Optimalt Antall Klynger
I motsetning til K-means gir ikke hierarkisk klynging et fast antall klynger direkte. I stedet produserer det et hierarki. Du trenger en metode for å avgjøre hvor du skal kutte dendrogrammet for å oppnå ønsket antall klynger.
Metoder for å bestemme antall klynger
For å finne det optimale antallet klynger brukes flere vanlige metoder, inkludert dendrogramvisualisering, albue-metoden og silhuettmetoden.
Dendrogramvisualisering
Denne metoden innebærer visuell inspeksjon av dendrogrammet for de største vertikale gapene som ikke krysses av horisontale linjer. Antallet klynger kan utledes fra antallet vertikale linjer disse gapene omfatter. Denne metoden er imidlertid subjektiv og avhenger i stor grad av visuell tolkning.
Albue-metoden (ved bruk av within-cluster sum of squares - WCSS)
I denne tilnærmingen utfører du hierarkisk klynging for et utvalg av klyngenummer og beregner WCSS for hver. Ved å plotte WCSS-verdiene mot antall klynger kan du identifisere et "albuepunkt" i grafen. Dette punktet indikerer en god balanse mellom å minimere WCSS og å unngå et for høyt antall klynger, på samme måte som albue-metoden i K-means.
Silhuettmetoden
Denne metoden innebærer å beregne silhuettskårer for ulike antall klynger ved å kutte dendrogrammet på forskjellige høyder. Det optimale antallet klynger er det som tilsvarer høyest gjennomsnittlig silhuettskår.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 2.94
Optimalt Antall Klynger
Sveip for å vise menyen
I motsetning til K-means gir ikke hierarkisk klynging et fast antall klynger direkte. I stedet produserer det et hierarki. Du trenger en metode for å avgjøre hvor du skal kutte dendrogrammet for å oppnå ønsket antall klynger.
Metoder for å bestemme antall klynger
For å finne det optimale antallet klynger brukes flere vanlige metoder, inkludert dendrogramvisualisering, albue-metoden og silhuettmetoden.
Dendrogramvisualisering
Denne metoden innebærer visuell inspeksjon av dendrogrammet for de største vertikale gapene som ikke krysses av horisontale linjer. Antallet klynger kan utledes fra antallet vertikale linjer disse gapene omfatter. Denne metoden er imidlertid subjektiv og avhenger i stor grad av visuell tolkning.
Albue-metoden (ved bruk av within-cluster sum of squares - WCSS)
I denne tilnærmingen utfører du hierarkisk klynging for et utvalg av klyngenummer og beregner WCSS for hver. Ved å plotte WCSS-verdiene mot antall klynger kan du identifisere et "albuepunkt" i grafen. Dette punktet indikerer en god balanse mellom å minimere WCSS og å unngå et for høyt antall klynger, på samme måte som albue-metoden i K-means.
Silhuettmetoden
Denne metoden innebærer å beregne silhuettskårer for ulike antall klynger ved å kutte dendrogrammet på forskjellige høyder. Det optimale antallet klynger er det som tilsvarer høyest gjennomsnittlig silhuettskår.
Takk for tilbakemeldingene dine!