Modeller
Grunnleggende om dataprosessering og oppbygging av pipelines er nå dekket. Neste steg er modellering.
En modell i Scikit-learn er en estimator som tilbyr metodene .predict() og .score(), i tillegg til .fit() som arves fra alle estimatorer.
.fit()
Når dataene er forhåndsprosesserte og klare for modellen, er det første steget i å bygge en modell å trene en modell. Dette gjøres ved å bruke .fit(X, y).
For supervised learning (regresjon, klassifisering) krever .fit() både X og y.
For unsupervised learning (f.eks. klynging) kaller du kun .fit(X). Å sende inn y gir ingen feil — det blir bare ignorert.
Under trening lærer modellen mønstre som trengs for prediksjon. Hva den lærer og hvor lang tid treningen tar, avhenger av algoritmen. Trening er ofte den tregeste delen av maskinlæring, spesielt med store datasett.
.predict()
Etter trening brukes .predict() for å generere prediksjoner:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() evaluerer en trent modell, vanligvis på et testsett:
model.fit(X, y)
model.score(X_test, y_test)
Den sammenligner prediksjoner med faktiske målverdier. Som standard er metrikken nøyaktighet for klassifisering.
X_test refererer til delsettet av datasettet, kjent som testsettet, som brukes til å evaluere modellens ytelse etter trening. Det inneholder funksjonene (inputdata). y_test er det tilsvarende delsettet av sanne etiketter for X_test. Sammen vurderer de hvor godt modellen predikerer nye, ukjente data.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
What are some common algorithms used for modeling in Scikit-learn?
Can you explain the difference between `.fit()`, `.predict()`, and `.score()` in more detail?
How do I choose which metric to use for evaluating my model?
Awesome!
Completion rate improved to 3.13
Modeller
Sveip for å vise menyen
Grunnleggende om dataprosessering og oppbygging av pipelines er nå dekket. Neste steg er modellering.
En modell i Scikit-learn er en estimator som tilbyr metodene .predict() og .score(), i tillegg til .fit() som arves fra alle estimatorer.
.fit()
Når dataene er forhåndsprosesserte og klare for modellen, er det første steget i å bygge en modell å trene en modell. Dette gjøres ved å bruke .fit(X, y).
For supervised learning (regresjon, klassifisering) krever .fit() både X og y.
For unsupervised learning (f.eks. klynging) kaller du kun .fit(X). Å sende inn y gir ingen feil — det blir bare ignorert.
Under trening lærer modellen mønstre som trengs for prediksjon. Hva den lærer og hvor lang tid treningen tar, avhenger av algoritmen. Trening er ofte den tregeste delen av maskinlæring, spesielt med store datasett.
.predict()
Etter trening brukes .predict() for å generere prediksjoner:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() evaluerer en trent modell, vanligvis på et testsett:
model.fit(X, y)
model.score(X_test, y_test)
Den sammenligner prediksjoner med faktiske målverdier. Som standard er metrikken nøyaktighet for klassifisering.
X_test refererer til delsettet av datasettet, kjent som testsettet, som brukes til å evaluere modellens ytelse etter trening. Det inneholder funksjonene (inputdata). y_test er det tilsvarende delsettet av sanne etiketter for X_test. Sammen vurderer de hvor godt modellen predikerer nye, ukjente data.
Takk for tilbakemeldingene dine!