Scikit-learnin Käsitteet
scikit-learn (tuodaan nimellä sklearn) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn-oliot ovat estimoija, muunnin, ennustaja ja malli.
Estimoija
Jokainen sklearn-luokka, jolla on .fit()-metodi, luokitellaan estimoijaksi. .fit()-metodi mahdollistaa olion oppimisen datasta.
Toisin sanoen, .fit()-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X ja y (y on valinnainen ohjaamattomissa oppimistehtävissä).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: muunnin ja ennustaja.
Muunnin
Muuntimella on .fit()-metodi ja .transform()-metodi, jotka muokkaavat dataa jollakin tavalla.
Yleensä muuntimet täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit() ja sitten .transform(). Tämän välttämiseksi muuntimilla on myös .fit_transform()-metodi.
.fit_transform() tuottaa saman tuloksen kuin .fit() ja .transform() peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform()-yhdistelmän sijaan.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Muuntimia käytetään yleensä muuttamaan X-taulukkoa. Kuitenkin, kuten näemme LabelEncoder-esimerkissä, jotkut muuntimet on tarkoitettu y-taulukolle.
nan-arvot, jotka näkyvät harjoitusaineistossa kuvassa, osoittavat puuttuvia tietoja Pythonissa.
Ennustaja
Ennustaja on estimaattori (sisältää .fit()-metodin), jolla on myös .predict()-metodi. .predict()-metodia käytetään ennusteiden tekemiseen.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Malli
Malli on ennustajan tyyppi, joka sisältää myös .score()-metodin. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka ilmaisee oikeiden ennusteiden prosenttiosuuden.
Esikäsittelyvaiheessa työskennellään muuntimien (transformers) kanssa, ja mallinnusvaiheessa käytetään ennustimia (tarkemmin sanottuna malleja).
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between a transformer and a predictor?
What are some common examples of transformers and predictors in scikit-learn?
How do I choose which scikit-learn object to use for my task?
Awesome!
Completion rate improved to 3.13
Scikit-learnin Käsitteet
Pyyhkäise näyttääksesi valikon
scikit-learn (tuodaan nimellä sklearn) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn-oliot ovat estimoija, muunnin, ennustaja ja malli.
Estimoija
Jokainen sklearn-luokka, jolla on .fit()-metodi, luokitellaan estimoijaksi. .fit()-metodi mahdollistaa olion oppimisen datasta.
Toisin sanoen, .fit()-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X ja y (y on valinnainen ohjaamattomissa oppimistehtävissä).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: muunnin ja ennustaja.
Muunnin
Muuntimella on .fit()-metodi ja .transform()-metodi, jotka muokkaavat dataa jollakin tavalla.
Yleensä muuntimet täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit() ja sitten .transform(). Tämän välttämiseksi muuntimilla on myös .fit_transform()-metodi.
.fit_transform() tuottaa saman tuloksen kuin .fit() ja .transform() peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform()-yhdistelmän sijaan.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Muuntimia käytetään yleensä muuttamaan X-taulukkoa. Kuitenkin, kuten näemme LabelEncoder-esimerkissä, jotkut muuntimet on tarkoitettu y-taulukolle.
nan-arvot, jotka näkyvät harjoitusaineistossa kuvassa, osoittavat puuttuvia tietoja Pythonissa.
Ennustaja
Ennustaja on estimaattori (sisältää .fit()-metodin), jolla on myös .predict()-metodi. .predict()-metodia käytetään ennusteiden tekemiseen.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Malli
Malli on ennustajan tyyppi, joka sisältää myös .score()-metodin. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka ilmaisee oikeiden ennusteiden prosenttiosuuden.
Esikäsittelyvaiheessa työskennellään muuntimien (transformers) kanssa, ja mallinnusvaiheessa käytetään ennustimia (tarkemmin sanottuna malleja).
Kiitos palautteestasi!