Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Modeller | Modellering
Introduksjon til maskinlæring med Python

bookModeller

Grunnleggende om dataprosessering og oppbygging av pipelines er nå dekket. Neste steg er modellering.

En modell i Scikit-learn er en estimator som tilbyr metodene .predict() og .score(), i tillegg til .fit() som arves fra alle estimatorer.

.fit()

Når dataene er forhåndsprosesserte og klare for modellen, er det første steget i å bygge en modell å trene en modell. Dette gjøres ved å bruke .fit(X, y).

Note
Merk

For supervised learning (regresjon, klassifisering) krever .fit() både X og y. For unsupervised learning (f.eks. klynging) kaller du kun .fit(X). Å sende inn y gir ingen feil — det blir bare ignorert.

Under trening lærer modellen mønstre som trengs for prediksjon. Hva den lærer og hvor lang tid treningen tar, avhenger av algoritmen. Trening er ofte den tregeste delen av maskinlæring, spesielt med store datasett.

.predict()

Etter trening brukes .predict() for å generere prediksjoner:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() evaluerer en trent modell, vanligvis på et testsett:

model.fit(X, y)
model.score(X_test, y_test)

Den sammenligner prediksjoner med faktiske målverdier. Som standard er metrikken nøyaktighet for klassifisering.

Note
Merk

X_test refererer til delsettet av datasettet, kjent som testsettet, som brukes til å evaluere modellens ytelse etter trening. Det inneholder funksjonene (inputdata). y_test er det tilsvarende delsettet av sanne etiketter for X_test. Sammen vurderer de hvor godt modellen predikerer nye, ukjente data.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 1

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

What are some common algorithms used for modeling in Scikit-learn?

Can you explain the difference between `.fit()`, `.predict()`, and `.score()` in more detail?

How do I choose which metric to use for evaluating my model?

Awesome!

Completion rate improved to 3.13

bookModeller

Sveip for å vise menyen

Grunnleggende om dataprosessering og oppbygging av pipelines er nå dekket. Neste steg er modellering.

En modell i Scikit-learn er en estimator som tilbyr metodene .predict() og .score(), i tillegg til .fit() som arves fra alle estimatorer.

.fit()

Når dataene er forhåndsprosesserte og klare for modellen, er det første steget i å bygge en modell å trene en modell. Dette gjøres ved å bruke .fit(X, y).

Note
Merk

For supervised learning (regresjon, klassifisering) krever .fit() både X og y. For unsupervised learning (f.eks. klynging) kaller du kun .fit(X). Å sende inn y gir ingen feil — det blir bare ignorert.

Under trening lærer modellen mønstre som trengs for prediksjon. Hva den lærer og hvor lang tid treningen tar, avhenger av algoritmen. Trening er ofte den tregeste delen av maskinlæring, spesielt med store datasett.

.predict()

Etter trening brukes .predict() for å generere prediksjoner:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() evaluerer en trent modell, vanligvis på et testsett:

model.fit(X, y)
model.score(X_test, y_test)

Den sammenligner prediksjoner med faktiske målverdier. Som standard er metrikken nøyaktighet for klassifisering.

Note
Merk

X_test refererer til delsettet av datasettet, kjent som testsettet, som brukes til å evaluere modellens ytelse etter trening. Det inneholder funksjonene (inputdata). y_test er det tilsvarende delsettet av sanne etiketter for X_test. Sammen vurderer de hvor godt modellen predikerer nye, ukjente data.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 1
some-alt