Modeller
De grundlæggende principper for datapreprocessering og opbygning af pipelines er nu dækket. Næste skridt er modellering.
En model i Scikit-learn er en estimator, der tilbyder metoderne .predict() og .score(), sammen med .fit() som arves fra alle estimators.
.fit()
Når dataene er forbehandlet og klar til modellen, er det første skridt i opbygningen af en model træning af en model. Dette udføres ved hjælp af .fit(X, y).
For supervised learning (regression, classification), .fit() kræver både X og y.
For unsupervised learning (f.eks. clustering), kaldes .fit(X) kun. At videregive y forårsager ingen fejl — det ignoreres blot.
Under træning lærer modellen mønstre, der er nødvendige for forudsigelse. Hvad den lærer, og hvor lang tid træningen tager, afhænger af algoritmen. Træning er ofte den langsomste del af ML, især med store datasæt.
.predict()
Efter træning bruges .predict() til at generere forudsigelser:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() evaluerer en trænet model, typisk på et test-sæt:
model.fit(X, y)
model.score(X_test, y_test)
Den sammenligner forudsigelser med de sande mål. Som standard er metrikken nøjagtighed for klassifikation.
X_test refererer til den delmængde af datasættet, kendt som test-sættet, der bruges til at evaluere en models præstation efter træning. Det indeholder features (inputdata). y_test er den tilsvarende delmængde af sande labels for X_test. Sammen vurderer de, hvor godt modellen forudsiger nye, usete data.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.13
Modeller
Stryg for at vise menuen
De grundlæggende principper for datapreprocessering og opbygning af pipelines er nu dækket. Næste skridt er modellering.
En model i Scikit-learn er en estimator, der tilbyder metoderne .predict() og .score(), sammen med .fit() som arves fra alle estimators.
.fit()
Når dataene er forbehandlet og klar til modellen, er det første skridt i opbygningen af en model træning af en model. Dette udføres ved hjælp af .fit(X, y).
For supervised learning (regression, classification), .fit() kræver både X og y.
For unsupervised learning (f.eks. clustering), kaldes .fit(X) kun. At videregive y forårsager ingen fejl — det ignoreres blot.
Under træning lærer modellen mønstre, der er nødvendige for forudsigelse. Hvad den lærer, og hvor lang tid træningen tager, afhænger af algoritmen. Træning er ofte den langsomste del af ML, især med store datasæt.
.predict()
Efter træning bruges .predict() til at generere forudsigelser:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() evaluerer en trænet model, typisk på et test-sæt:
model.fit(X, y)
model.score(X_test, y_test)
Den sammenligner forudsigelser med de sande mål. Som standard er metrikken nøjagtighed for klassifikation.
X_test refererer til den delmængde af datasættet, kendt som test-sættet, der bruges til at evaluere en models præstation efter træning. Det indeholder features (inputdata). y_test er den tilsvarende delmængde af sande labels for X_test. Sammen vurderer de, hvor godt modellen forudsiger nye, usete data.
Tak for dine kommentarer!