Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Optimalt Antal Klynger | Sektion
Grundlæggende Ikke-Superviseret Læring

bookOptimalt Antal Klynger

I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet skaber det et hierarki. Du skal bruge en metode til at afgøre, hvor du skal skære dendrogrammet for at opnå det ønskede antal klynger.

Metoder til bestemmelse af antal klynger

For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogram-visualisering, elbow-metoden og silhuetmetoden.

Dendrogram-visualisering

Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.

Elbow-metoden (ved brug af within-cluster sum of squares - WCSS)

I denne tilgang udfører du hierarkisk klyngedannelse for et interval af klyngeantal og beregner WCSS for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan du identificere et "elbow"-punkt i plottet. Dette punkt indikerer en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til elbow-metoden i K-means.

Silhuetmetoden

Denne metode indebærer beregning af silhuet-scorer for forskellige antal klynger ved at skære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.

Note
Bemærk

Beregning af WCSS og silhuet-scorer for hierarkisk klyngedannelse kan være beregningsmæssigt krævende, især for store datasæt.

Når du vælger antal klynger, bør din forståelse af dataene og det problem, du forsøger at løse, også vejlede dit valg.

question mark

Hvilken af følgende metoder bruges ofte til at bestemme antallet af klynger i hierarkisk klyngedannelse?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 15

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

bookOptimalt Antal Klynger

Stryg for at vise menuen

I modsætning til K-means producerer hierarkisk klyngedannelse ikke direkte et fast antal klynger. I stedet skaber det et hierarki. Du skal bruge en metode til at afgøre, hvor du skal skære dendrogrammet for at opnå det ønskede antal klynger.

Metoder til bestemmelse af antal klynger

For at bestemme det optimale antal klynger anvendes flere metoder ofte, herunder dendrogram-visualisering, elbow-metoden og silhuetmetoden.

Dendrogram-visualisering

Denne metode indebærer visuel inspektion af dendrogrammet for de største lodrette mellemrum, der ikke krydses af vandrette linjer. Antallet af klynger kan udledes ud fra antallet af lodrette linjer, disse mellemrum omfatter. Denne metode er dog subjektiv og afhænger i høj grad af visuel fortolkning.

Elbow-metoden (ved brug af within-cluster sum of squares - WCSS)

I denne tilgang udfører du hierarkisk klyngedannelse for et interval af klyngeantal og beregner WCSS for hver. Ved at plotte WCSS-værdierne mod antallet af klynger kan du identificere et "elbow"-punkt i plottet. Dette punkt indikerer en god balance mellem at minimere WCSS og undgå et for stort antal klynger, svarende til elbow-metoden i K-means.

Silhuetmetoden

Denne metode indebærer beregning af silhuet-scorer for forskellige antal klynger ved at skære dendrogrammet ved forskellige højder. Det optimale antal klynger er det, der svarer til den højeste gennemsnitlige silhuet-score.

Note
Bemærk

Beregning af WCSS og silhuet-scorer for hierarkisk klyngedannelse kan være beregningsmæssigt krævende, især for store datasæt.

Når du vælger antal klynger, bør din forståelse af dataene og det problem, du forsøger at løse, også vejlede dit valg.

question mark

Hvilken af følgende metoder bruges ofte til at bestemme antallet af klynger i hierarkisk klyngedannelse?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 15
some-alt