Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Modeller | Modellering
Introduktion til Maskinlæring med Python

Modeller

Stryg for at vise menuen

Grundlæggende dataforbehandling og opbygning af pipelines er nu dækket. Næste skridt er modellering.

En model i Scikit-learn er en estimator, der tilbyder metoderne .predict() og .score(), samt .fit() som arves fra alle estimators.

Model

.fit()

Når dataene er forbehandlet og klar til at blive sendt til modellen, er det første skridt i opbygningen af en model at træne en model. Dette gøres ved hjælp af .fit(X, y).

Note
Bemærk

For supervised learning (regression, klassifikation) kræver .fit() både X og y. For unsupervised learning (f.eks. clustering) kaldes kun .fit(X). Hvis y gives med, ignoreres det blot og giver ikke fejl.

Under træningen lærer modellen de mønstre, der er nødvendige for at lave forudsigelser. Hvad den lærer, og hvor lang tid træningen tager, afhænger af algoritmen. Træning er ofte den langsomste del af ML, især med store datasæt.

.predict()

Efter træning bruges .predict() til at generere forudsigelser:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() evaluerer en trænet model, typisk på et testdatasæt:

model.fit(X, y)
model.score(X_test, y_test)

Den sammenligner forudsigelser med de sande mål. Som standard er metrikken nøjagtighed for klassifikation.

Nøjagtighed
Note
Bemærk

X_test henviser til det datasæt, der kaldes testdatasættet, som bruges til at evaluere en models ydeevne efter træning. Det indeholder features (inputdata). y_test er det tilsvarende sæt af sande labels for X_test. Sammen vurderer de, hvor godt modellen forudsiger nye, usete data.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 4. Kapitel 1
some-alt