Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Modellen | Modellering
Introductie tot Machine Learning met Python

bookModellen

De basisprincipes van gegevensvoorbewerking en het opzetten van pipelines zijn nu behandeld. De volgende stap is modelleren.

Een model in Scikit-learn is een schatter die de methoden .predict() en .score() biedt, samen met .fit() die wordt geërfd van alle schatters.

.fit()

Zodra de gegevens zijn voorbewerkt en klaar zijn voor het model, is de eerste stap bij het bouwen van een model het trainen van een model. Dit gebeurt met behulp van .fit(X, y).

Note
Opmerking

Voor supervised learning (regressie, classificatie) vereist .fit() zowel X als y. Voor unsupervised learning (bijv. clustering) gebruik je alleen .fit(X). Het meegeven van y veroorzaakt geen fout — het wordt simpelweg genegeerd.

Tijdens het trainen leert het model patronen die nodig zijn voor voorspellingen. Wat het model leert en hoe lang het trainen duurt, hangt af van het algoritme. Training is vaak het traagste onderdeel van machine learning, vooral bij grote datasets.

.predict()

Na het trainen gebruik je .predict() om voorspellingen te genereren:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() evalueert een getraind model, meestal op een testset:

model.fit(X, y)
model.score(X_test, y_test)

Het vergelijkt voorspellingen met werkelijke doelen. Standaard is de metriek nauwkeurigheid voor classificatie.

Note
Opmerking

X_test verwijst naar de subset van de dataset, bekend als de testset, die wordt gebruikt om de prestaties van een model na training te evalueren. Het bevat de kenmerken (invoergegevens). y_test is de bijbehorende subset van ware labels voor X_test. Samen beoordelen ze hoe goed het model nieuwe, ongeziene gegevens voorspelt.

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 1

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 3.13

bookModellen

Veeg om het menu te tonen

De basisprincipes van gegevensvoorbewerking en het opzetten van pipelines zijn nu behandeld. De volgende stap is modelleren.

Een model in Scikit-learn is een schatter die de methoden .predict() en .score() biedt, samen met .fit() die wordt geërfd van alle schatters.

.fit()

Zodra de gegevens zijn voorbewerkt en klaar zijn voor het model, is de eerste stap bij het bouwen van een model het trainen van een model. Dit gebeurt met behulp van .fit(X, y).

Note
Opmerking

Voor supervised learning (regressie, classificatie) vereist .fit() zowel X als y. Voor unsupervised learning (bijv. clustering) gebruik je alleen .fit(X). Het meegeven van y veroorzaakt geen fout — het wordt simpelweg genegeerd.

Tijdens het trainen leert het model patronen die nodig zijn voor voorspellingen. Wat het model leert en hoe lang het trainen duurt, hangt af van het algoritme. Training is vaak het traagste onderdeel van machine learning, vooral bij grote datasets.

.predict()

Na het trainen gebruik je .predict() om voorspellingen te genereren:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() evalueert een getraind model, meestal op een testset:

model.fit(X, y)
model.score(X_test, y_test)

Het vergelijkt voorspellingen met werkelijke doelen. Standaard is de metriek nauwkeurigheid voor classificatie.

Note
Opmerking

X_test verwijst naar de subset van de dataset, bekend als de testset, die wordt gebruikt om de prestaties van een model na training te evalueren. Het bevat de kenmerken (invoergegevens). y_test is de bijbehorende subset van ware labels voor X_test. Samen beoordelen ze hoe goed het model nieuwe, ongeziene gegevens voorspelt.

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 1
some-alt