Mallit
Pyyhkäise näyttääksesi valikon
Tietojen esikäsittelyn ja putkistojen rakentamisen perusteet on nyt käsitelty. Seuraava vaihe on mallintaminen.
Malli Scikit-learnissa on estimaattori, joka tarjoaa .predict()- ja .score()-metodit sekä kaikilta estimaattoreilta perityn .fit()-metodin.
.fit()
Kun data on esikäsitelty ja valmis mallille, ensimmäinen vaihe mallin rakentamisessa on mallin kouluttaminen. Tämä tehdään käyttämällä .fit(X, y)-metodia.
Valvotussa oppimisessa (regressio, luokittelu) .fit() vaatii sekä X että y.
Valvomattomassa oppimisessa (esim. klusterointi) kutsutaan vain .fit(X). y:n välittäminen ei aiheuta virhettä — se yksinkertaisesti ohitetaan.
Koulutuksen aikana malli oppii ennustamiseen tarvittavat säännönmukaisuudet. Mitä malli oppii ja kuinka kauan koulutus kestää riippuu algoritmista. Koulutus on usein hitainta koneoppimisessa, erityisesti suurilla aineistoilla.
.predict()
Koulutuksen jälkeen käytetään .predict()-metodia ennusteiden tuottamiseen:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() arvioi koulutetun mallin, tyypillisesti testijoukolla:
model.fit(X, y)
model.score(X_test, y_test)
Se vertaa ennusteita todellisiin kohteisiin. Oletuksena metriikkana on tarkkuus luokittelussa.
X_test viittaa tietojoukon osajoukkoon, jota kutsutaan testijoukoksi, ja jota käytetään mallin suorituskyvyn arviointiin koulutuksen jälkeen. Se sisältää piirteet (syötedata). y_test on vastaava osajoukko todellisia luokkia X_test:lle. Näiden avulla arvioidaan, kuinka hyvin malli ennustaa uutta, aiemmin näkemätöntä dataa.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme