Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Scikit-learn-Concepten | Gegevens Preprocessen met Scikit-learn
ML-Introductie met Scikit-learn

bookScikit-learn-Concepten

De scikit-learn-bibliotheek (geïmporteerd als sklearn) biedt diverse functies en klassen voor het preprocessen van data en modelleren. De belangrijkste sklearn-objecten zijn estimator, transformer, predictor en model.

Estimator

Elke klasse van sklearn met de .fit()-methode wordt beschouwd als een estimator. De .fit()-methode stelt een object in staat om te leren van de data.

Met andere woorden, de .fit()-methode wordt gebruikt voor het trainen van een object. Deze methode neemt de parameters X en y (y is optioneel voor unsupervised learning taken).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Het is niet erg nuttig als een object alleen leert van data zonder enig resultaat te produceren. Praktischer zijn de twee typen objecten die overerven van de estimator: de transformer en de predictor.

Transformer

Een transformer beschikt over de methoden .fit() en .transform() waarmee de data op een bepaalde manier wordt getransformeerd.

Meestal moet een transformer iets leren van de data voordat deze getransformeerd kan worden, daarom moet je eerst .fit() toepassen en daarna .transform(). Om dit te vereenvoudigen, beschikken transformers ook over de methode .fit_transform().
.fit_transform() levert hetzelfde resultaat op als het achtereenvolgens toepassen van .fit() en .transform(), maar is soms sneller en daarom te verkiezen boven .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Opmerking

Transformers worden meestal gebruikt om de X array te transformeren. Zoals we echter zullen zien in het voorbeeld van LabelEncoder, zijn sommige transformers bedoeld voor de y array.

nan-waarden die in de trainingsset op de afbeelding worden weergegeven, duiden op ontbrekende data in Python.

Predictor

Een predictor is een schatter (heeft de .fit()-methode) die ook de .predict()-methode bevat. De .predict()-methode wordt gebruikt voor het maken van voorspellingen.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Model

Een model is een type predictor dat ook de .score()-methode bevat. Deze methode berekent een score (metriek) om de prestaties van de predictor te meten.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Zoals vermeld in het vorige hoofdstuk, is nauwkeurigheid een metriek die het percentage correcte voorspellingen weergeeft.

De preprocessing-fase omvat het werken met transformers, en we werken met voorspellers (meer specifiek met modellen) in de modellering-fase.

question mark

Selecteer alle juiste uitspraken.

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 1

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 3.13

bookScikit-learn-Concepten

Veeg om het menu te tonen

De scikit-learn-bibliotheek (geïmporteerd als sklearn) biedt diverse functies en klassen voor het preprocessen van data en modelleren. De belangrijkste sklearn-objecten zijn estimator, transformer, predictor en model.

Estimator

Elke klasse van sklearn met de .fit()-methode wordt beschouwd als een estimator. De .fit()-methode stelt een object in staat om te leren van de data.

Met andere woorden, de .fit()-methode wordt gebruikt voor het trainen van een object. Deze methode neemt de parameters X en y (y is optioneel voor unsupervised learning taken).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Het is niet erg nuttig als een object alleen leert van data zonder enig resultaat te produceren. Praktischer zijn de twee typen objecten die overerven van de estimator: de transformer en de predictor.

Transformer

Een transformer beschikt over de methoden .fit() en .transform() waarmee de data op een bepaalde manier wordt getransformeerd.

Meestal moet een transformer iets leren van de data voordat deze getransformeerd kan worden, daarom moet je eerst .fit() toepassen en daarna .transform(). Om dit te vereenvoudigen, beschikken transformers ook over de methode .fit_transform().
.fit_transform() levert hetzelfde resultaat op als het achtereenvolgens toepassen van .fit() en .transform(), maar is soms sneller en daarom te verkiezen boven .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Opmerking

Transformers worden meestal gebruikt om de X array te transformeren. Zoals we echter zullen zien in het voorbeeld van LabelEncoder, zijn sommige transformers bedoeld voor de y array.

nan-waarden die in de trainingsset op de afbeelding worden weergegeven, duiden op ontbrekende data in Python.

Predictor

Een predictor is een schatter (heeft de .fit()-methode) die ook de .predict()-methode bevat. De .predict()-methode wordt gebruikt voor het maken van voorspellingen.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Model

Een model is een type predictor dat ook de .score()-methode bevat. Deze methode berekent een score (metriek) om de prestaties van de predictor te meten.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Zoals vermeld in het vorige hoofdstuk, is nauwkeurigheid een metriek die het percentage correcte voorspellingen weergeeft.

De preprocessing-fase omvat het werken met transformers, en we werken met voorspellers (meer specifiek met modellen) in de modellering-fase.

question mark

Selecteer alle juiste uitspraken.

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 1
some-alt