Optimalt Antal Klynger
I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet skaber den et hierarki. Du skal bruge en metode til at afgøre, hvor du skal skære dendrogrammet for at opnå det ønskede antal klynger.
Metoder til at bestemme antallet af klynger
For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogram-visualisering, albue-metoden og silhuet-metoden.
Dendrogram-visualisering
Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.
Albue-metoden (ved brug af within-cluster sum of squares - WCSS)
I denne tilgang udfører du hierarkisk klyngedannelse for et interval af klyngeantal og beregner WCSS for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan du identificere et "albuepunkt" i plottet. Dette punkt angiver en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til albue-metoden i K-means.
Silhuet-metoden
Denne metode indebærer beregning af silhuet-scorer for forskellige antal klynger ved at skære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 2.94
Optimalt Antal Klynger
Stryg for at vise menuen
I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet skaber den et hierarki. Du skal bruge en metode til at afgøre, hvor du skal skære dendrogrammet for at opnå det ønskede antal klynger.
Metoder til at bestemme antallet af klynger
For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogram-visualisering, albue-metoden og silhuet-metoden.
Dendrogram-visualisering
Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.
Albue-metoden (ved brug af within-cluster sum of squares - WCSS)
I denne tilgang udfører du hierarkisk klyngedannelse for et interval af klyngeantal og beregner WCSS for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan du identificere et "albuepunkt" i plottet. Dette punkt angiver en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til albue-metoden i K-means.
Silhuet-metoden
Denne metode indebærer beregning af silhuet-scorer for forskellige antal klynger ved at skære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.
Tak for dine kommentarer!