Modellen
Je kent inmiddels de basis van het preprocessen van je data en het bouwen van pipelines. Nu kunnen we doorgaan naar het leuke gedeelte, modelleren!
Laten we herhalen wat een model is. In Scikit-learn is dit een estimator die zowel de methoden .predict()
als .score()
heeft (en omdat het een estimator is, is de methode .fit()
ook aanwezig).
.fit()
Zodra de data is voorbewerkt en klaar is voor het model, is de eerste stap bij het bouwen van een model het trainen van een model. Dit gebeurt met behulp van .fit(X, y)
.
Tijdens het trainen leert een model alles wat nodig is om voorspellingen te doen. Wat het model leert en de duur van de training hangen af van het gekozen algoritme. Voor elke taak zijn er talrijke modellen beschikbaar, gebaseerd op verschillende algoritmen. Sommige trainen langzamer, terwijl andere sneller trainen.
Toch is trainen over het algemeen het meest tijdrovende aspect van machine learning. Als de trainingsset groot is, kan het trainen van een model minuten, uren of zelfs dagen duren.
.predict()
Zodra het model is getraind met de .fit()
-methode, kan het voorspellingen uitvoeren. Voorspellen is eenvoudig door de .predict()
-methode aan te roepen:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Meestal wil je een doelvariabele voorspellen voor nieuwe instanties, X_new
.
.score()
De .score()
-methode wordt gebruikt om de prestaties van een getraind model te meten. Gewoonlijk wordt deze berekend op de testset (de volgende hoofdstukken leggen uit wat dit is). Hier is de syntaxis:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
De .score()
-methode vereist werkelijke doelwaarden (y_test
in het voorbeeld). Het berekent de voorspelling voor X_test
-instanties en vergelijkt deze voorspelling met de ware doelwaarde (y_test
) met behulp van een bepaalde metriek. Standaard is deze metriek nauwkeurigheid voor classificatie.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Modellen
Veeg om het menu te tonen
Je kent inmiddels de basis van het preprocessen van je data en het bouwen van pipelines. Nu kunnen we doorgaan naar het leuke gedeelte, modelleren!
Laten we herhalen wat een model is. In Scikit-learn is dit een estimator die zowel de methoden .predict()
als .score()
heeft (en omdat het een estimator is, is de methode .fit()
ook aanwezig).
.fit()
Zodra de data is voorbewerkt en klaar is voor het model, is de eerste stap bij het bouwen van een model het trainen van een model. Dit gebeurt met behulp van .fit(X, y)
.
Tijdens het trainen leert een model alles wat nodig is om voorspellingen te doen. Wat het model leert en de duur van de training hangen af van het gekozen algoritme. Voor elke taak zijn er talrijke modellen beschikbaar, gebaseerd op verschillende algoritmen. Sommige trainen langzamer, terwijl andere sneller trainen.
Toch is trainen over het algemeen het meest tijdrovende aspect van machine learning. Als de trainingsset groot is, kan het trainen van een model minuten, uren of zelfs dagen duren.
.predict()
Zodra het model is getraind met de .fit()
-methode, kan het voorspellingen uitvoeren. Voorspellen is eenvoudig door de .predict()
-methode aan te roepen:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Meestal wil je een doelvariabele voorspellen voor nieuwe instanties, X_new
.
.score()
De .score()
-methode wordt gebruikt om de prestaties van een getraind model te meten. Gewoonlijk wordt deze berekend op de testset (de volgende hoofdstukken leggen uit wat dit is). Hier is de syntaxis:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
De .score()
-methode vereist werkelijke doelwaarden (y_test
in het voorbeeld). Het berekent de voorspelling voor X_test
-instanties en vergelijkt deze voorspelling met de ware doelwaarde (y_test
) met behulp van een bepaalde metriek. Standaard is deze metriek nauwkeurigheid voor classificatie.
Bedankt voor je feedback!