Optimalt Antal Klynger
I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet genereres en hierarki. Det er nødvendigt at anvende en metode til at afgøre, hvor dendrogrammet skal afskæres for at opnå det ønskede antal klynger.
Metoder til bestemmelse af antal klynger
For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogramvisualisering, elbow-metoden og silhuetmetoden.
Dendrogramvisualisering
Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, som disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.
Elbow-metoden (ved brug af within-cluster sum of squares - WCSS)
I denne tilgang udføres hierarkisk klyngedannelse for et interval af klyngenavne, og WCSS beregnes for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan et "elbow"-punkt identificeres i plottet. Dette punkt angiver en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til elbow-metoden i K-means.
Silhuetmetoden
Denne metode indebærer beregning af silhuet-score for forskellige antal klynger ved at afskære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.
Beregning af WCSS og silhuet-score for hierarkisk klyngedannelse kan være beregningsmæssigt krævende, især for store datasæt.
Ved valg af antal klynger bør din forståelse af dataene og det problem, der skal løses, også indgå i overvejelserne.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 2.94
Optimalt Antal Klynger
Stryg for at vise menuen
I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet genereres en hierarki. Det er nødvendigt at anvende en metode til at afgøre, hvor dendrogrammet skal afskæres for at opnå det ønskede antal klynger.
Metoder til bestemmelse af antal klynger
For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogramvisualisering, elbow-metoden og silhuetmetoden.
Dendrogramvisualisering
Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, som disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.
Elbow-metoden (ved brug af within-cluster sum of squares - WCSS)
I denne tilgang udføres hierarkisk klyngedannelse for et interval af klyngenavne, og WCSS beregnes for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan et "elbow"-punkt identificeres i plottet. Dette punkt angiver en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til elbow-metoden i K-means.
Silhuetmetoden
Denne metode indebærer beregning af silhuet-score for forskellige antal klynger ved at afskære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.
Beregning af WCSS og silhuet-score for hierarkisk klyngedannelse kan være beregningsmæssigt krævende, især for store datasæt.
Ved valg af antal klynger bør din forståelse af dataene og det problem, der skal løses, også indgå i overvejelserne.
Tak for dine kommentarer!