Modeller
Du kender allerede det grundlæggende i at forbehandle dine data og opbygge pipelines. Nu kan vi gå videre til den spændende del, modellering!
Lad os opsummere, hvad en model er. I Scikit-learn er det en estimator, der har både .predict()
og .score()
metoder (og da det er en estimator, er .fit()
metoden også til stede).
.fit()
Når dataene er forbehandlet og klar til modellen, er det første skridt i at opbygge en model at træne en model. Dette gøres ved hjælp af .fit(X, y)
.
Under træningen lærer en model alt, hvad den behøver for at kunne lave forudsigelser. Hvad modellen lærer, og hvor længe træningen varer, afhænger af den valgte algoritme. For hver opgave findes der adskillige modeller baseret på forskellige algoritmer. Nogle træner langsommere, mens andre træner hurtigere.
Dog er træning generelt den mest tidskrævende del af maskinlæring. Hvis træningssættet er stort, kan det tage minutter, timer eller endda dage at træne en model.
.predict()
Når modellen er trænet ved hjælp af .fit()
-metoden, kan den udføre forudsigelser. Forudsigelse foretages blot ved at kalde .predict()
-metoden:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Normalt ønsker man at forudsige et mål for nye instanser, X_new
.
.score()
Metoden .score()
bruges til at måle en trænet models præstation. Den beregnes typisk på testdatasættet (de følgende kapitler forklarer, hvad det er). Her er syntaksen:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Metoden .score()
kræver faktiske mål-værdier (y_test
i eksemplet). Den beregner forudsigelsen for X_test
-instanser og sammenligner denne forudsigelse med det sande mål (y_test
) ved hjælp af en eller anden metrisk metode. Som standard er denne metrik nøjagtighed for klassifikation.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.13
Modeller
Stryg for at vise menuen
Du kender allerede det grundlæggende i at forbehandle dine data og opbygge pipelines. Nu kan vi gå videre til den spændende del, modellering!
Lad os opsummere, hvad en model er. I Scikit-learn er det en estimator, der har både .predict()
og .score()
metoder (og da det er en estimator, er .fit()
metoden også til stede).
.fit()
Når dataene er forbehandlet og klar til modellen, er det første skridt i at opbygge en model at træne en model. Dette gøres ved hjælp af .fit(X, y)
.
Under træningen lærer en model alt, hvad den behøver for at kunne lave forudsigelser. Hvad modellen lærer, og hvor længe træningen varer, afhænger af den valgte algoritme. For hver opgave findes der adskillige modeller baseret på forskellige algoritmer. Nogle træner langsommere, mens andre træner hurtigere.
Dog er træning generelt den mest tidskrævende del af maskinlæring. Hvis træningssættet er stort, kan det tage minutter, timer eller endda dage at træne en model.
.predict()
Når modellen er trænet ved hjælp af .fit()
-metoden, kan den udføre forudsigelser. Forudsigelse foretages blot ved at kalde .predict()
-metoden:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Normalt ønsker man at forudsige et mål for nye instanser, X_new
.
.score()
Metoden .score()
bruges til at måle en trænet models præstation. Den beregnes typisk på testdatasættet (de følgende kapitler forklarer, hvad det er). Her er syntaksen:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Metoden .score()
kræver faktiske mål-værdier (y_test
i eksemplet). Den beregner forudsigelsen for X_test
-instanser og sammenligner denne forudsigelse med det sande mål (y_test
) ved hjælp af en eller anden metrisk metode. Som standard er denne metrik nøjagtighed for klassifikation.
Tak for dine kommentarer!