Mikä on luokittelu
Luokittelu on ohjatun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.
Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.
Luokittelussa on useita tyyppejä:
- Binaarinen luokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
- Moniluokkainen luokittelu: kolme tai useampia mahdollisia kategorioita (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/karkki);
- Monitunnisteinen luokittelu: havainto voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).
Useimmissa koneoppimismalleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa lopputulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa lopputulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).
Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä:
- k-lähimmän naapurin menetelmä;
- logistinen regressio;
- päätöspuu;
- satunnaismetsä.
Kaikki nämä löytyvät scikit-learn-kirjastosta ja ovat helppokäyttöisiä.
Mikään koneoppimismalli ei ole toista parempi. Parhaiten suoriutuva malli riippuu aina tietystä tehtävästä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between binary, multi-class, and multi-label classification in more detail?
What are some common use cases for classification and regression?
How do I choose which classification model to use for my data?
Awesome!
Completion rate improved to 4.17
Mikä on luokittelu
Pyyhkäise näyttääksesi valikon
Luokittelu on ohjatun oppimisen tehtävä, jossa tavoitteena on ennustaa havaintoyksikön luokka sen piirteiden perusteella. Malli oppii merkittyjen esimerkkien avulla opetusjoukosta ja liittää sitten luokan uuteen, aiemmin näkemättömään dataan.
Regressio ennustaa jatkuvan numeerisen arvon (esim. hinta), jolla voi olla useita mahdollisia arvoja. Luokittelu ennustaa kategorisen arvon (esim. makeistyypin), valiten yhden vaihtoehdon rajatusta luokkajoukosta.
Luokittelussa on useita tyyppejä:
- Binaarinen luokittelu: kohteella on kaksi mahdollista lopputulosta (roskaposti/ei roskaposti, keksi/ei keksi);
- Moniluokkainen luokittelu: kolme tai useampia mahdollisia kategorioita (roskaposti/tärkeä/mainos/muu; keksi/vaahtokarkki/karkki);
- Monitunnisteinen luokittelu: havainto voi kuulua useaan luokkaan samanaikaisesti (elokuva voi olla toiminta ja komedia; sähköposti voi olla tärkeä ja työhön liittyvä).
Useimmissa koneoppimismalleissa kohde täytyy koodata numeroksi. Binaarisessa luokittelussa lopputulokset koodataan yleensä 0/1 (esim. 1 - keksi, 0 - ei keksi). Moniluokkaisessa luokittelussa lopputulokset koodataan yleensä 0, 1, 2, ... (esim. 0 - karkki, 1 - keksi, 2 - vaahtokarkki).
Monet eri mallit voivat suorittaa luokittelua. Esimerkkejä:
- k-lähimmän naapurin menetelmä;
- logistinen regressio;
- päätöspuu;
- satunnaismetsä.
Kaikki nämä löytyvät scikit-learn-kirjastosta ja ovat helppokäyttöisiä.
Mikään koneoppimismalli ei ole toista parempi. Parhaiten suoriutuva malli riippuu aina tietystä tehtävästä.
Kiitos palautteestasi!