Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Modeller | Modellering
ML Introduktion med Scikit-learn

bookModeller

Du kender allerede det grundlæggende i at forbehandle dine data og opbygge pipelines. Nu kan vi gå videre til den spændende del, modellering!

Lad os opsummere, hvad en model er. I Scikit-learn er det en estimator, der har både .predict() og .score() metoder (og da det er en estimator, er .fit() metoden også til stede).

.fit()

Når dataene er forbehandlet og klar til modellen, er det første skridt i at opbygge en model at træne en model. Dette gøres ved hjælp af .fit(X, y).

Under træningen lærer en model alt, hvad den behøver for at kunne lave forudsigelser. Hvad modellen lærer, og hvor længe træningen varer, afhænger af den valgte algoritme. For hver opgave findes der adskillige modeller baseret på forskellige algoritmer. Nogle træner langsommere, mens andre træner hurtigere.

Dog er træning generelt den mest tidskrævende del af maskinlæring. Hvis træningssættet er stort, kan det tage minutter, timer eller endda dage at træne en model.

.predict()

Når modellen er trænet ved hjælp af .fit()-metoden, kan den udføre forudsigelser. Forudsigelse foretages blot ved at kalde .predict()-metoden:

model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction

Normalt ønsker man at forudsige et mål for nye instanser, X_new.

.score()

Metoden .score() bruges til at måle en trænet models præstation. Den beregnes typisk på testdatasættet (de følgende kapitler forklarer, hvad det er). Her er syntaksen:

model.fit(X, y) # Training the model
model.score(X_test, y_test)

Metoden .score() kræver faktiske mål-værdier (y_test i eksemplet). Den beregner forudsigelsen for X_test-instanser og sammenligner denne forudsigelse med det sande mål (y_test) ved hjælp af en eller anden metrisk metode. Som standard er denne metrik nøjagtighed for klassifikation.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 3.13

bookModeller

Stryg for at vise menuen

Du kender allerede det grundlæggende i at forbehandle dine data og opbygge pipelines. Nu kan vi gå videre til den spændende del, modellering!

Lad os opsummere, hvad en model er. I Scikit-learn er det en estimator, der har både .predict() og .score() metoder (og da det er en estimator, er .fit() metoden også til stede).

.fit()

Når dataene er forbehandlet og klar til modellen, er det første skridt i at opbygge en model at træne en model. Dette gøres ved hjælp af .fit(X, y).

Under træningen lærer en model alt, hvad den behøver for at kunne lave forudsigelser. Hvad modellen lærer, og hvor længe træningen varer, afhænger af den valgte algoritme. For hver opgave findes der adskillige modeller baseret på forskellige algoritmer. Nogle træner langsommere, mens andre træner hurtigere.

Dog er træning generelt den mest tidskrævende del af maskinlæring. Hvis træningssættet er stort, kan det tage minutter, timer eller endda dage at træne en model.

.predict()

Når modellen er trænet ved hjælp af .fit()-metoden, kan den udføre forudsigelser. Forudsigelse foretages blot ved at kalde .predict()-metoden:

model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction

Normalt ønsker man at forudsige et mål for nye instanser, X_new.

.score()

Metoden .score() bruges til at måle en trænet models præstation. Den beregnes typisk på testdatasættet (de følgende kapitler forklarer, hvad det er). Her er syntaksen:

model.fit(X, y) # Training the model
model.score(X_test, y_test)

Metoden .score() kræver faktiske mål-værdier (y_test i eksemplet). Den beregner forudsigelsen for X_test-instanser og sammenligner denne forudsigelse med det sande mål (y_test) ved hjælp af en eller anden metrisk metode. Som standard er denne metrik nøjagtighed for klassifikation.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1
some-alt