Mikä on luokittelu
Luokittelu on valvotun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.
Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.
Luokittelua on useita tyyppejä:
- Binaariluokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
- Moniluokkaluokittelu: kolme tai useampia mahdollisia luokkia (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/makeinen);
- Moniluokkainen luokittelu: havaintoyksikkö voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).
Useimmissa ML-malleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa tulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa tulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).
Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä ovat:
- k-lähimmät naapurit;
- logistinen regressio;
- päätöspuu;
- satunnaismetsä.
Kaikki nämä on onneksi toteutettu scikit-learn -kirjastossa ja ovat helppokäyttöisiä.
Mikään koneoppimismalli ei ole toista parempi. Parhaiten toimiva malli riippuu aina tehtävästä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 3.33
Mikä on luokittelu
Pyyhkäise näyttääksesi valikon
Luokittelu on valvotun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.
Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.
Luokittelua on useita tyyppejä:
- Binaariluokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
- Moniluokkaluokittelu: kolme tai useampia mahdollisia luokkia (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/makeinen);
- Moniluokkainen luokittelu: havaintoyksikkö voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).
Useimmissa ML-malleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa tulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa tulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).
Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä ovat:
- k-lähimmät naapurit;
- logistinen regressio;
- päätöspuu;
- satunnaismetsä.
Kaikki nämä on onneksi toteutettu scikit-learn -kirjastossa ja ovat helppokäyttöisiä.
Mikään koneoppimismalli ei ole toista parempi. Parhaiten toimiva malli riippuu aina tehtävästä.
Kiitos palautteestasi!