Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Scikit-learnin Käsitteet | Datan Esikäsittely Scikit-learnilla
Koneoppimisen Perusteet Scikit-learnilla

bookScikit-learnin Käsitteet

scikit-learn (tuodaan nimellä sklearn) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn-oliot ovat estimoija, muunnin, ennustaja ja malli.

Estimoija

Jokainen sklearn-luokka, jolla on .fit()-metodi, luokitellaan estimoijaksi. .fit()-metodi mahdollistaa olion oppimisen datasta.

Toisin sanoen, .fit()-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X ja y (y on valinnainen ohjaamattomissa oppimistehtävissä).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: muunnin ja ennustaja.

Muunnin

Muuntimella on .fit()-metodi ja .transform()-metodi, jotka muuntavat dataa jollakin tavalla.

Yleensä muuntimet täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit() ja sitten .transform(). Tämän välttämiseksi muuntimilla on myös .fit_transform()-metodi.
.fit_transform() tuottaa saman tuloksen kuin .fit() ja .transform() peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform() sijaan.

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Huomio

Muuntimia käytetään yleensä muuttamaan X-taulukkoa. Kuitenkin, kuten näemme LabelEncoder-esimerkissä, jotkut muuntimet on tarkoitettu y-taulukolle.

Kuvassa koulutusjoukossa näkyvät nan-arvot ilmaisevat puuttuvia tietoja Pythonissa.

Ennustaja

Ennustaja on estimaattori (sisältää .fit()-metodin), jolla on myös .predict()-metodi. .predict()-metodia käytetään ennusteiden tekemiseen.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Malli

Malli on ennustajan tyyppi, johon sisältyy myös .score()-metodi. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka kuvaa oikeiden ennusteiden prosenttiosuutta.

Esikäsittelyvaiheessa työskennellään muuntimien kanssa, ja mallinnusvaiheessa käytetään prediktoreita (tarkemmin sanottuna malleja).

question mark

Valitse kaikki oikeat väittämät.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 3.13

bookScikit-learnin Käsitteet

Pyyhkäise näyttääksesi valikon

scikit-learn (tuodaan nimellä sklearn) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn-oliot ovat estimoija, muunnin, ennustaja ja malli.

Estimoija

Jokainen sklearn-luokka, jolla on .fit()-metodi, luokitellaan estimoijaksi. .fit()-metodi mahdollistaa olion oppimisen datasta.

Toisin sanoen, .fit()-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X ja y (y on valinnainen ohjaamattomissa oppimistehtävissä).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: muunnin ja ennustaja.

Muunnin

Muuntimella on .fit()-metodi ja .transform()-metodi, jotka muuntavat dataa jollakin tavalla.

Yleensä muuntimet täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit() ja sitten .transform(). Tämän välttämiseksi muuntimilla on myös .fit_transform()-metodi.
.fit_transform() tuottaa saman tuloksen kuin .fit() ja .transform() peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform() sijaan.

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Huomio

Muuntimia käytetään yleensä muuttamaan X-taulukkoa. Kuitenkin, kuten näemme LabelEncoder-esimerkissä, jotkut muuntimet on tarkoitettu y-taulukolle.

Kuvassa koulutusjoukossa näkyvät nan-arvot ilmaisevat puuttuvia tietoja Pythonissa.

Ennustaja

Ennustaja on estimaattori (sisältää .fit()-metodin), jolla on myös .predict()-metodi. .predict()-metodia käytetään ennusteiden tekemiseen.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Malli

Malli on ennustajan tyyppi, johon sisältyy myös .score()-metodi. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka kuvaa oikeiden ennusteiden prosenttiosuutta.

Esikäsittelyvaiheessa työskennellään muuntimien kanssa, ja mallinnusvaiheessa käytetään prediktoreita (tarkemmin sanottuna malleja).

question mark

Valitse kaikki oikeat väittämät.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1
some-alt