Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Modeller | Modellering
Quizzes & Challenges
Quizzes
Challenges
/
Introduktion til Maskinlæring med Python

bookModeller

De grundlæggende principper for datapreprocessering og opbygning af pipelines er nu dækket. Næste skridt er modellering.

En model i Scikit-learn er en estimator, der tilbyder metoderne .predict() og .score(), sammen med .fit() som arves fra alle estimators.

.fit()

Når dataene er forbehandlet og klar til modellen, er det første skridt i opbygningen af en model træning af en model. Dette udføres ved hjælp af .fit(X, y).

Note
Bemærk

For supervised learning (regression, classification), .fit() kræver både X og y. For unsupervised learning (f.eks. clustering), kaldes .fit(X) kun. At videregive y forårsager ingen fejl — det ignoreres blot.

Under træning lærer modellen mønstre, der er nødvendige for forudsigelse. Hvad den lærer, og hvor lang tid træningen tager, afhænger af algoritmen. Træning er ofte den langsomste del af ML, især med store datasæt.

.predict()

Efter træning bruges .predict() til at generere forudsigelser:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() evaluerer en trænet model, typisk på et test-sæt:

model.fit(X, y)
model.score(X_test, y_test)

Den sammenligner forudsigelser med de sande mål. Som standard er metrikken nøjagtighed for klassifikation.

Note
Bemærk

X_test refererer til den delmængde af datasættet, kendt som test-sættet, der bruges til at evaluere en models præstation efter træning. Det indeholder features (inputdata). y_test er den tilsvarende delmængde af sande labels for X_test. Sammen vurderer de, hvor godt modellen forudsiger nye, usete data.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 3.13

bookModeller

Stryg for at vise menuen

De grundlæggende principper for datapreprocessering og opbygning af pipelines er nu dækket. Næste skridt er modellering.

En model i Scikit-learn er en estimator, der tilbyder metoderne .predict() og .score(), sammen med .fit() som arves fra alle estimators.

.fit()

Når dataene er forbehandlet og klar til modellen, er det første skridt i opbygningen af en model træning af en model. Dette udføres ved hjælp af .fit(X, y).

Note
Bemærk

For supervised learning (regression, classification), .fit() kræver både X og y. For unsupervised learning (f.eks. clustering), kaldes .fit(X) kun. At videregive y forårsager ingen fejl — det ignoreres blot.

Under træning lærer modellen mønstre, der er nødvendige for forudsigelse. Hvad den lærer, og hvor lang tid træningen tager, afhænger af algoritmen. Træning er ofte den langsomste del af ML, især med store datasæt.

.predict()

Efter træning bruges .predict() til at generere forudsigelser:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() evaluerer en trænet model, typisk på et test-sæt:

model.fit(X, y)
model.score(X_test, y_test)

Den sammenligner forudsigelser med de sande mål. Som standard er metrikken nøjagtighed for klassifikation.

Note
Bemærk

X_test refererer til den delmængde af datasættet, kendt som test-sættet, der bruges til at evaluere en models præstation efter træning. Det indeholder features (inputdata). y_test er den tilsvarende delmængde af sande labels for X_test. Sammen vurderer de, hvor godt modellen forudsiger nye, usete data.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1
some-alt