Pyyhkäise näyttääksesi valikon

Edellytykset

Luokittelu on ohjatun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uusiin, aiemmin näkemättömiin tietoihin.

Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.

Luokittelua on useita tyyppejä:

Binaariluokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
Moniluokkainen luokittelu: kolme tai useampia mahdollisia kategorioita (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/makeinen);
Moniluokkainen moniluokittelu: yksittäinen havainto voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).

Useimpien koneoppimismallien kohdalla kohde täytyy koodata numeroksi. Binaarisessa luokittelussa tulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa tulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).

Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä ovat:

k-lähimmät naapurit;
logistinen regressio;
päätöspuu;
satunnaismetsä.

Kaikki nämä löytyvät scikit-learn-kirjastosta ja ovat helppokäyttöisiä.

Huomio

Mikään koneoppimismalli ei ole toista parempi. Parhaiten suoriutuva malli riippuu aina käsillä olevasta tehtävästä.

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 1. Luku 1

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Mikä on luokittelu