Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Optimalt Antal Klynger | Hierarkisk Klyngedannelse
Klyngeanalyse

bookOptimalt Antal Klynger

I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet genereres en hierarki. Det er nødvendigt at anvende en metode til at afgøre, hvor dendrogrammet skal afskæres for at opnå det ønskede antal klynger.

Metoder til bestemmelse af antal klynger

For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogramvisualisering, elbow-metoden og silhuetmetoden.

Dendrogramvisualisering

Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, som disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.

Elbow-metoden (ved brug af within-cluster sum of squares - WCSS)

I denne tilgang udføres hierarkisk klyngedannelse for et interval af klyngenavne, og WCSS beregnes for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan et "elbow"-punkt identificeres i plottet. Dette punkt angiver en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til elbow-metoden i K-means.

Silhuetmetoden

Denne metode indebærer beregning af silhuet-score for forskellige antal klynger ved at afskære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.

Note
Bemærk

Beregning af WCSS og silhuet-score for hierarkisk klyngedannelse kan være beregningsmæssigt krævende, især for store datasæt.

Ved valg af antal klynger bør din forståelse af dataene og det problem, der skal løses, også indgå i overvejelserne.

question mark

Hvilken af følgende er en almindeligt anvendt metode til at bestemme antallet af klynger i hierarkisk klyngedannelse?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 2.94

bookOptimalt Antal Klynger

Stryg for at vise menuen

I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet genereres en hierarki. Det er nødvendigt at anvende en metode til at afgøre, hvor dendrogrammet skal afskæres for at opnå det ønskede antal klynger.

Metoder til bestemmelse af antal klynger

For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogramvisualisering, elbow-metoden og silhuetmetoden.

Dendrogramvisualisering

Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, som disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.

Elbow-metoden (ved brug af within-cluster sum of squares - WCSS)

I denne tilgang udføres hierarkisk klyngedannelse for et interval af klyngenavne, og WCSS beregnes for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan et "elbow"-punkt identificeres i plottet. Dette punkt angiver en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til elbow-metoden i K-means.

Silhuetmetoden

Denne metode indebærer beregning af silhuet-score for forskellige antal klynger ved at afskære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.

Note
Bemærk

Beregning af WCSS og silhuet-score for hierarkisk klyngedannelse kan være beregningsmæssigt krævende, især for store datasæt.

Ved valg af antal klynger bør din forståelse af dataene og det problem, der skal løses, også indgå i overvejelserne.

question mark

Hvilken af følgende er en almindeligt anvendt metode til at bestemme antallet af klynger i hierarkisk klyngedannelse?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2
some-alt