Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Mikä on luokittelu | Osio
Ohjatun Oppimisen Perusteet

bookMikä on luokittelu

Luokittelu on valvotun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.

Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.

Luokittelua on useita tyyppejä:

  • Binaariluokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
  • Moniluokkaluokittelu: kolme tai useampia mahdollisia luokkia (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/makeinen);
  • Moniluokkainen luokittelu: havaintoyksikkö voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).

Useimmissa ML-malleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa tulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa tulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).

Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä ovat:

  • k-lähimmät naapurit;
  • logistinen regressio;
  • päätöspuu;
  • satunnaismetsä.

Kaikki nämä on onneksi toteutettu scikit-learn -kirjastossa ja ovat helppokäyttöisiä.

Note
Huomio

Mikään koneoppimismalli ei ole toista parempi. Parhaiten toimiva malli riippuu aina tehtävästä.

question mark

Mikä on luokittelun päätavoite koneoppimisessa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 14

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookMikä on luokittelu

Pyyhkäise näyttääksesi valikon

Luokittelu on valvotun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.

Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.

Luokittelua on useita tyyppejä:

  • Binaariluokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
  • Moniluokkaluokittelu: kolme tai useampia mahdollisia luokkia (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/makeinen);
  • Moniluokkainen luokittelu: havaintoyksikkö voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).

Useimmissa ML-malleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa tulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa tulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).

Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä ovat:

  • k-lähimmät naapurit;
  • logistinen regressio;
  • päätöspuu;
  • satunnaismetsä.

Kaikki nämä on onneksi toteutettu scikit-learn -kirjastossa ja ovat helppokäyttöisiä.

Note
Huomio

Mikään koneoppimismalli ei ole toista parempi. Parhaiten toimiva malli riippuu aina tehtävästä.

question mark

Mikä on luokittelun päätavoite koneoppimisessa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 14
some-alt