Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Klustereiden Optimaalinen Määrä | Hierarkkinen Klusterointi
Klusterianalyysi

bookKlustereiden Optimaalinen Määrä

Toisin kuin K-means-menetelmässä, hierarkkinen klusterointi ei tuota suoraan kiinteää määrää klustereita, vaan muodostaa hierarkian. Tarvitset menetelmän päättääksesi, mihin kohtaan dendrogrammi katkaistaan halutun klusterimäärän saamiseksi.

Menetelmät klustereiden määrän määrittämiseksi

Optimaalisen klusterimäärän määrittämiseen käytetään yleisesti useita menetelmiä, kuten dendrogrammin visualisointia, kyynärpäämenetelmää ja silhuettimenetelmää.

Dendrogrammin visualisointi

Tässä menetelmässä tarkastellaan dendrogrammia visuaalisesti etsimällä suurimmat pystysuorat aukot, joita vaakasuorat viivat eivät leikkaa. Klustereiden määrä voidaan päätellä näiden aukkojen kattamien pystysuorien viivojen lukumäärästä. Tämä menetelmä on kuitenkin subjektiivinen ja perustuu vahvasti visuaaliseen tulkintaan.

Kyynärpäämenetelmä (within-cluster sum of squares - WCSS)

Tässä lähestymistavassa suoritetaan hierarkkinen klusterointi useilla eri klusterimäärillä ja lasketaan kullekin WCSS. Piirtämällä WCSS-arvot klusterimäärää vastaan voidaan tunnistaa kuvaajasta "kyynärpääkohta". Tämä kohta osoittaa hyvän tasapainon WCSS:n minimoinnin ja liiallisen klusterimäärän väliltä, samoin kuin K-means-menetelmässä.

Silhuettimenetelmä

Tässä menetelmässä lasketaan silhuettipisteet eri klusterimäärille katkaisemalla dendrogrammi eri korkeuksilta. Optimaalinen klusterimäärä on se, joka tuottaa korkeimman keskimääräisen silhuettipisteen.

question mark

Mikä seuraavista on yleisesti käytetty menetelmä klustereiden määrän määrittämiseksi hierarkkisessa klusteroinnissa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 2.94

bookKlustereiden Optimaalinen Määrä

Pyyhkäise näyttääksesi valikon

Toisin kuin K-means-menetelmässä, hierarkkinen klusterointi ei tuota suoraan kiinteää määrää klustereita, vaan muodostaa hierarkian. Tarvitset menetelmän päättääksesi, mihin kohtaan dendrogrammi katkaistaan halutun klusterimäärän saamiseksi.

Menetelmät klustereiden määrän määrittämiseksi

Optimaalisen klusterimäärän määrittämiseen käytetään yleisesti useita menetelmiä, kuten dendrogrammin visualisointia, kyynärpäämenetelmää ja silhuettimenetelmää.

Dendrogrammin visualisointi

Tässä menetelmässä tarkastellaan dendrogrammia visuaalisesti etsimällä suurimmat pystysuorat aukot, joita vaakasuorat viivat eivät leikkaa. Klustereiden määrä voidaan päätellä näiden aukkojen kattamien pystysuorien viivojen lukumäärästä. Tämä menetelmä on kuitenkin subjektiivinen ja perustuu vahvasti visuaaliseen tulkintaan.

Kyynärpäämenetelmä (within-cluster sum of squares - WCSS)

Tässä lähestymistavassa suoritetaan hierarkkinen klusterointi useilla eri klusterimäärillä ja lasketaan kullekin WCSS. Piirtämällä WCSS-arvot klusterimäärää vastaan voidaan tunnistaa kuvaajasta "kyynärpääkohta". Tämä kohta osoittaa hyvän tasapainon WCSS:n minimoinnin ja liiallisen klusterimäärän väliltä, samoin kuin K-means-menetelmässä.

Silhuettimenetelmä

Tässä menetelmässä lasketaan silhuettipisteet eri klusterimäärille katkaisemalla dendrogrammi eri korkeuksilta. Optimaalinen klusterimäärä on se, joka tuottaa korkeimman keskimääräisen silhuettipisteen.

question mark

Mikä seuraavista on yleisesti käytetty menetelmä klustereiden määrän määrittämiseksi hierarkkisessa klusteroinnissa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 2
some-alt