Scikit-learn-Concepten
De scikit-learn-bibliotheek (geïmporteerd als sklearn
) biedt diverse functies en klassen voor het preprocessen van data en modelleren. De belangrijkste sklearn
-objecten zijn estimator, transformer, predictor en model.
Estimator
Elke klasse van sklearn
met de .fit()
-methode wordt beschouwd als een estimator. De .fit()
-methode stelt een object in staat om te leren van de data.
Met andere woorden, de .fit()
-methode wordt gebruikt voor het trainen van een object. Deze methode neemt de parameters X
en y
(y
is optioneel voor unsupervised learning taken).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Het is niet erg nuttig als een object alleen leert van data zonder enig resultaat te produceren. Praktischer zijn de twee typen objecten die overerven van de estimator: de transformer en de predictor.
Transformer
Een transformer beschikt over de methoden .fit()
en .transform()
waarmee de data op een bepaalde manier wordt getransformeerd.
Meestal moet een transformer iets leren van de data voordat deze getransformeerd kan worden, daarom moet je eerst .fit()
toepassen en daarna .transform()
. Om dit te vereenvoudigen, beschikken transformers ook over de methode .fit_transform()
.
.fit_transform()
levert hetzelfde resultaat op als het achtereenvolgens toepassen van .fit()
en .transform()
, maar is soms sneller en daarom te verkiezen boven .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformers worden meestal gebruikt om de X
array te transformeren. Zoals we echter zullen zien in het voorbeeld van LabelEncoder
, zijn sommige transformers bedoeld voor de y
array.
nan
-waarden die in de trainingsset op de afbeelding worden weergegeven, duiden op ontbrekende data in Python.
Predictor
Een predictor is een schatter (heeft de .fit()
-methode) die ook de .predict()
-methode bevat. De .predict()
-methode wordt gebruikt voor het maken van voorspellingen.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Model
Een model is een type predictor dat ook de .score()
-methode bevat. Deze methode berekent een score (metriek) om de prestaties van de predictor te meten.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Zoals vermeld in het vorige hoofdstuk, is nauwkeurigheid een metriek die het percentage correcte voorspellingen weergeeft.
De preprocessing-fase omvat het werken met transformers, en we werken met voorspellers (meer specifiek met modellen) in de modellering-fase.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Scikit-learn-Concepten
Veeg om het menu te tonen
De scikit-learn-bibliotheek (geïmporteerd als sklearn
) biedt diverse functies en klassen voor het preprocessen van data en modelleren. De belangrijkste sklearn
-objecten zijn estimator, transformer, predictor en model.
Estimator
Elke klasse van sklearn
met de .fit()
-methode wordt beschouwd als een estimator. De .fit()
-methode stelt een object in staat om te leren van de data.
Met andere woorden, de .fit()
-methode wordt gebruikt voor het trainen van een object. Deze methode neemt de parameters X
en y
(y
is optioneel voor unsupervised learning taken).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Het is niet erg nuttig als een object alleen leert van data zonder enig resultaat te produceren. Praktischer zijn de twee typen objecten die overerven van de estimator: de transformer en de predictor.
Transformer
Een transformer beschikt over de methoden .fit()
en .transform()
waarmee de data op een bepaalde manier wordt getransformeerd.
Meestal moet een transformer iets leren van de data voordat deze getransformeerd kan worden, daarom moet je eerst .fit()
toepassen en daarna .transform()
. Om dit te vereenvoudigen, beschikken transformers ook over de methode .fit_transform()
.
.fit_transform()
levert hetzelfde resultaat op als het achtereenvolgens toepassen van .fit()
en .transform()
, maar is soms sneller en daarom te verkiezen boven .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformers worden meestal gebruikt om de X
array te transformeren. Zoals we echter zullen zien in het voorbeeld van LabelEncoder
, zijn sommige transformers bedoeld voor de y
array.
nan
-waarden die in de trainingsset op de afbeelding worden weergegeven, duiden op ontbrekende data in Python.
Predictor
Een predictor is een schatter (heeft de .fit()
-methode) die ook de .predict()
-methode bevat. De .predict()
-methode wordt gebruikt voor het maken van voorspellingen.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Model
Een model is een type predictor dat ook de .score()
-methode bevat. Deze methode berekent een score (metriek) om de prestaties van de predictor te meten.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Zoals vermeld in het vorige hoofdstuk, is nauwkeurigheid een metriek die het percentage correcte voorspellingen weergeeft.
De preprocessing-fase omvat het werken met transformers, en we werken met voorspellers (meer specifiek met modellen) in de modellering-fase.
Bedankt voor je feedback!