Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Mikä on luokittelu | K-NN-luokitin
Luokittelu Pythonilla

bookMikä on luokittelu

Luokittelu on ohjatun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.

Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.

Luokittelussa on useita tyyppejä:

  • Binaarinen luokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
  • Moniluokkainen luokittelu: kolme tai useampia mahdollisia kategorioita (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/karkki);
  • Monitunnisteinen luokittelu: havainto voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).

Useimmissa koneoppimismalleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa lopputulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa lopputulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).

Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä:

  • k-lähimmän naapurin menetelmä;
  • logistinen regressio;
  • päätöspuu;
  • satunnaismetsä.

Kaikki nämä löytyvät scikit-learn-kirjastosta ja ovat helppokäyttöisiä.

Note
Huomio

Mikään koneoppimismalli ei ole toista parempi. Parhaiten suoriutuva malli riippuu aina tietystä tehtävästä.

question mark

Mikä on luokittelun päätavoite koneoppimisessa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between binary, multi-class, and multi-label classification in more detail?

What are some common use cases for classification and regression?

How do I choose which classification model to use for my data?

Awesome!

Completion rate improved to 4.17

bookMikä on luokittelu

Pyyhkäise näyttääksesi valikon

Luokittelu on ohjatun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.

Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.

Luokittelussa on useita tyyppejä:

  • Binaarinen luokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
  • Moniluokkainen luokittelu: kolme tai useampia mahdollisia kategorioita (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/karkki);
  • Monitunnisteinen luokittelu: havainto voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).

Useimmissa koneoppimismalleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa lopputulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa lopputulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).

Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä:

  • k-lähimmän naapurin menetelmä;
  • logistinen regressio;
  • päätöspuu;
  • satunnaismetsä.

Kaikki nämä löytyvät scikit-learn-kirjastosta ja ovat helppokäyttöisiä.

Note
Huomio

Mikään koneoppimismalli ei ole toista parempi. Parhaiten suoriutuva malli riippuu aina tietystä tehtävästä.

question mark

Mikä on luokittelun päätavoite koneoppimisessa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1
some-alt