Modeller
Du kjenner allerede til det grunnleggende om forhåndsprosessering av data og hvordan du bygger pipelines. Nå kan vi gå videre til den interessante delen, modellering!
La oss oppsummere hva en modell er. I Scikit-learn er det en estimator som har både metodene .predict()
og .score()
(og siden det er en estimator, er også .fit()
-metoden til stede).
.fit()
Når dataene er forhåndsprosessert og klare til å sendes til modellen, er det første steget i å bygge en modell å trene en modell. Dette gjøres ved å bruke .fit(X, y)
.
Under opplæring lærer en modell alt den trenger for å kunne gjøre prediksjoner. Hva modellen lærer og hvor lenge den trenes avhenger av valgt algoritme. For hver oppgave finnes det mange modeller, basert på ulike algoritmer. Noen trenes saktere, mens andre trenes raskere.
Likevel er opplæring generelt den mest tidkrevende delen av maskinlæring. Hvis treningssettet er stort, kan det ta minutter, timer eller til og med dager å trene en modell.
.predict()
Når modellen er trent ved hjelp av .fit()
-metoden, kan den utføre prediksjoner. Predikering gjøres enkelt ved å kalle .predict()
-metoden:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Vanligvis ønsker du å predikere et mål for nye instanser, X_new
.
.score()
Metoden .score()
brukes til å måle ytelsen til en trent modell. Vanligvis beregnes dette på testsettet (de neste kapitlene forklarer hva dette er). Her er syntaksen:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Metoden .score()
krever faktiske målverdier (y_test
i eksemplet). Den beregner prediksjonen for X_test
-instanser og sammenligner denne prediksjonen med sanne målverdier (y_test
) ved hjelp av en metrikk. Som standard er denne metrikken nøyaktighet for klassifisering.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.13
Modeller
Sveip for å vise menyen
Du kjenner allerede til det grunnleggende om forhåndsprosessering av data og hvordan du bygger pipelines. Nå kan vi gå videre til den interessante delen, modellering!
La oss oppsummere hva en modell er. I Scikit-learn er det en estimator som har både metodene .predict()
og .score()
(og siden det er en estimator, er også .fit()
-metoden til stede).
.fit()
Når dataene er forhåndsprosessert og klare til å sendes til modellen, er det første steget i å bygge en modell å trene en modell. Dette gjøres ved å bruke .fit(X, y)
.
Under opplæring lærer en modell alt den trenger for å kunne gjøre prediksjoner. Hva modellen lærer og hvor lenge den trenes avhenger av valgt algoritme. For hver oppgave finnes det mange modeller, basert på ulike algoritmer. Noen trenes saktere, mens andre trenes raskere.
Likevel er opplæring generelt den mest tidkrevende delen av maskinlæring. Hvis treningssettet er stort, kan det ta minutter, timer eller til og med dager å trene en modell.
.predict()
Når modellen er trent ved hjelp av .fit()
-metoden, kan den utføre prediksjoner. Predikering gjøres enkelt ved å kalle .predict()
-metoden:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Vanligvis ønsker du å predikere et mål for nye instanser, X_new
.
.score()
Metoden .score()
brukes til å måle ytelsen til en trent modell. Vanligvis beregnes dette på testsettet (de neste kapitlene forklarer hva dette er). Her er syntaksen:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Metoden .score()
krever faktiske målverdier (y_test
i eksemplet). Den beregner prediksjonen for X_test
-instanser og sammenligner denne prediksjonen med sanne målverdier (y_test
) ved hjelp av en metrikk. Som standard er denne metrikken nøyaktighet for klassifisering.
Takk for tilbakemeldingene dine!