Klustereiden Optimaalinen Määrä
Toisin kuin K-means-menetelmässä, hierarkkinen klusterointi ei tuota suoraan kiinteää määrää klustereita, vaan muodostaa hierarkian. Tarvitset menetelmän päättääksesi, mihin kohtaan dendrogrammi katkaistaan halutun klusterimäärän saamiseksi.
Menetelmät klustereiden määrän määrittämiseksi
Optimaalisen klusterimäärän määrittämiseen käytetään yleisesti useita menetelmiä, kuten dendrogrammin visualisointia, kyynärpäämenetelmää ja silhuettimenetelmää.
Dendrogrammin visualisointi
Tässä menetelmässä tarkastellaan dendrogrammia visuaalisesti etsimällä suurimmat pystysuorat aukot, joita vaakasuorat viivat eivät leikkaa. Klustereiden määrä voidaan päätellä näiden aukkojen kattamien pystysuorien viivojen lukumäärästä. Tämä menetelmä on kuitenkin subjektiivinen ja perustuu vahvasti visuaaliseen tulkintaan.
Kyynärpäämenetelmä (within-cluster sum of squares - WCSS)
Tässä lähestymistavassa suoritetaan hierarkkinen klusterointi useilla eri klusterimäärillä ja lasketaan kullekin WCSS. Piirtämällä WCSS-arvot klusterimäärää vastaan voidaan tunnistaa kuvaajasta "kyynärpääkohta". Tämä kohta osoittaa hyvän tasapainon WCSS:n minimoinnin ja liiallisen klusterimäärän väliltä, samoin kuin K-means-menetelmässä.
Silhuettimenetelmä
Tässä menetelmässä lasketaan silhuettipisteet eri klusterimäärille katkaisemalla dendrogrammi eri korkeuksilta. Optimaalinen klusterimäärä on se, joka tuottaa korkeimman keskimääräisen silhuettipisteen.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 2.94
Klustereiden Optimaalinen Määrä
Pyyhkäise näyttääksesi valikon
Toisin kuin K-means-menetelmässä, hierarkkinen klusterointi ei tuota suoraan kiinteää määrää klustereita, vaan muodostaa hierarkian. Tarvitset menetelmän päättääksesi, mihin kohtaan dendrogrammi katkaistaan halutun klusterimäärän saamiseksi.
Menetelmät klustereiden määrän määrittämiseksi
Optimaalisen klusterimäärän määrittämiseen käytetään yleisesti useita menetelmiä, kuten dendrogrammin visualisointia, kyynärpäämenetelmää ja silhuettimenetelmää.
Dendrogrammin visualisointi
Tässä menetelmässä tarkastellaan dendrogrammia visuaalisesti etsimällä suurimmat pystysuorat aukot, joita vaakasuorat viivat eivät leikkaa. Klustereiden määrä voidaan päätellä näiden aukkojen kattamien pystysuorien viivojen lukumäärästä. Tämä menetelmä on kuitenkin subjektiivinen ja perustuu vahvasti visuaaliseen tulkintaan.
Kyynärpäämenetelmä (within-cluster sum of squares - WCSS)
Tässä lähestymistavassa suoritetaan hierarkkinen klusterointi useilla eri klusterimäärillä ja lasketaan kullekin WCSS. Piirtämällä WCSS-arvot klusterimäärää vastaan voidaan tunnistaa kuvaajasta "kyynärpääkohta". Tämä kohta osoittaa hyvän tasapainon WCSS:n minimoinnin ja liiallisen klusterimäärän väliltä, samoin kuin K-means-menetelmässä.
Silhuettimenetelmä
Tässä menetelmässä lasketaan silhuettipisteet eri klusterimäärille katkaisemalla dendrogrammi eri korkeuksilta. Optimaalinen klusterimäärä on se, joka tuottaa korkeimman keskimääräisen silhuettipisteen.
Kiitos palautteestasi!