Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Modellen | Modellering
ML Introductie Met Scikit-learn

bookModellen

Je kent inmiddels de basis van het preprocessen van je data en het bouwen van pipelines. Nu kunnen we doorgaan naar het leuke gedeelte, modelleren!

Laten we herhalen wat een model is. In Scikit-learn is dit een estimator die zowel de methoden .predict() als .score() heeft (en omdat het een estimator is, is de methode .fit() ook aanwezig).

.fit()

Zodra de data is voorbewerkt en klaar is voor het model, is de eerste stap bij het bouwen van een model het trainen van een model. Dit gebeurt met behulp van .fit(X, y).

Tijdens het trainen leert een model alles wat nodig is om voorspellingen te doen. Wat het model leert en de duur van de training hangen af van het gekozen algoritme. Voor elke taak zijn er talrijke modellen beschikbaar, gebaseerd op verschillende algoritmen. Sommige trainen langzamer, terwijl andere sneller trainen.

Toch is trainen over het algemeen het meest tijdrovende aspect van machine learning. Als de trainingsset groot is, kan het trainen van een model minuten, uren of zelfs dagen duren.

.predict()

Zodra het model is getraind met de .fit()-methode, kan het voorspellingen uitvoeren. Voorspellen is eenvoudig door de .predict()-methode aan te roepen:

model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction

Meestal wil je een doelvariabele voorspellen voor nieuwe instanties, X_new.

.score()

De .score()-methode wordt gebruikt om de prestaties van een getraind model te meten. Gewoonlijk wordt deze berekend op de testset (de volgende hoofdstukken leggen uit wat dit is). Hier is de syntaxis:

model.fit(X, y) # Training the model
model.score(X_test, y_test)

De .score()-methode vereist werkelijke doelwaarden (y_test in het voorbeeld). Het berekent de voorspelling voor X_test-instanties en vergelijkt deze voorspelling met de ware doelwaarde (y_test) met behulp van een bepaalde metriek. Standaard is deze metriek nauwkeurigheid voor classificatie.

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 1

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 3.13

bookModellen

Veeg om het menu te tonen

Je kent inmiddels de basis van het preprocessen van je data en het bouwen van pipelines. Nu kunnen we doorgaan naar het leuke gedeelte, modelleren!

Laten we herhalen wat een model is. In Scikit-learn is dit een estimator die zowel de methoden .predict() als .score() heeft (en omdat het een estimator is, is de methode .fit() ook aanwezig).

.fit()

Zodra de data is voorbewerkt en klaar is voor het model, is de eerste stap bij het bouwen van een model het trainen van een model. Dit gebeurt met behulp van .fit(X, y).

Tijdens het trainen leert een model alles wat nodig is om voorspellingen te doen. Wat het model leert en de duur van de training hangen af van het gekozen algoritme. Voor elke taak zijn er talrijke modellen beschikbaar, gebaseerd op verschillende algoritmen. Sommige trainen langzamer, terwijl andere sneller trainen.

Toch is trainen over het algemeen het meest tijdrovende aspect van machine learning. Als de trainingsset groot is, kan het trainen van een model minuten, uren of zelfs dagen duren.

.predict()

Zodra het model is getraind met de .fit()-methode, kan het voorspellingen uitvoeren. Voorspellen is eenvoudig door de .predict()-methode aan te roepen:

model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction

Meestal wil je een doelvariabele voorspellen voor nieuwe instanties, X_new.

.score()

De .score()-methode wordt gebruikt om de prestaties van een getraind model te meten. Gewoonlijk wordt deze berekend op de testset (de volgende hoofdstukken leggen uit wat dit is). Hier is de syntaxis:

model.fit(X, y) # Training the model
model.score(X_test, y_test)

De .score()-methode vereist werkelijke doelwaarden (y_test in het voorbeeld). Het berekent de voorspelling voor X_test-instanties en vergelijkt deze voorspelling met de ware doelwaarde (y_test) met behulp van een bepaalde metriek. Standaard is deze metriek nauwkeurigheid voor classificatie.

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 1
some-alt