Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Optimalt Antall Klynger | Hierarkisk Klynging
Klyngeanalyse

bookOptimalt Antall Klynger

I motsetning til K-means gir ikke hierarkisk klynging et fast antall klynger direkte. I stedet produserer den et hierarki. Du trenger en metode for å avgjøre hvor du skal kutte dendrogrammet for å oppnå ønsket antall klynger.

Metoder for å bestemme antall klynger

For å finne det optimale antallet klynger brukes ofte flere metoder, inkludert dendrogramvisualisering, albue-metoden og silhuettmetoden.

Dendrogramvisualisering

Denne metoden innebærer visuell inspeksjon av dendrogrammet for de største vertikale gapene som ikke krysses av horisontale linjer. Antall klynger kan utledes fra antall vertikale linjer disse gapene omfatter. Denne metoden er imidlertid subjektiv og avhenger i stor grad av visuell tolkning.

Albue-metoden (ved bruk av within-cluster sum of squares - WCSS)

I denne tilnærmingen utfører du hierarkisk klynging for et utvalg av klyngenummer og beregner WCSS for hver. Ved å plotte WCSS-verdiene mot antall klynger kan du identifisere et "albuepunkt" i grafen. Dette punktet indikerer en god balanse mellom å minimere WCSS og å unngå et for høyt antall klynger, på samme måte som albue-metoden i K-means.

Silhuettmetoden

Denne metoden innebærer å beregne silhuettskårer for ulike antall klynger ved å kutte dendrogrammet på forskjellige høyder. Det optimale antallet klynger er det som tilsvarer høyest gjennomsnittlig silhuettskår.

Note
Merk

Beregning av WCSS og silhuettskårer for hierarkisk klynging kan være beregningstungt, spesielt for store datasett.

Når du velger antall klynger, bør også din forståelse av dataene og problemet du prøver å løse veilede valget ditt.

question mark

Hvilken av følgende metoder brukes ofte for å bestemme antall klynger i hierarkisk klynging?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 2

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain how to interpret a dendrogram to choose the number of clusters?

What are the steps to calculate the silhouette score for hierarchical clustering?

How does the elbow method work differently in hierarchical clustering compared to K-means?

Awesome!

Completion rate improved to 2.94

bookOptimalt Antall Klynger

Sveip for å vise menyen

I motsetning til K-means gir ikke hierarkisk klynging et fast antall klynger direkte. I stedet produserer den et hierarki. Du trenger en metode for å avgjøre hvor du skal kutte dendrogrammet for å oppnå ønsket antall klynger.

Metoder for å bestemme antall klynger

For å finne det optimale antallet klynger brukes ofte flere metoder, inkludert dendrogramvisualisering, albue-metoden og silhuettmetoden.

Dendrogramvisualisering

Denne metoden innebærer visuell inspeksjon av dendrogrammet for de største vertikale gapene som ikke krysses av horisontale linjer. Antall klynger kan utledes fra antall vertikale linjer disse gapene omfatter. Denne metoden er imidlertid subjektiv og avhenger i stor grad av visuell tolkning.

Albue-metoden (ved bruk av within-cluster sum of squares - WCSS)

I denne tilnærmingen utfører du hierarkisk klynging for et utvalg av klyngenummer og beregner WCSS for hver. Ved å plotte WCSS-verdiene mot antall klynger kan du identifisere et "albuepunkt" i grafen. Dette punktet indikerer en god balanse mellom å minimere WCSS og å unngå et for høyt antall klynger, på samme måte som albue-metoden i K-means.

Silhuettmetoden

Denne metoden innebærer å beregne silhuettskårer for ulike antall klynger ved å kutte dendrogrammet på forskjellige høyder. Det optimale antallet klynger er det som tilsvarer høyest gjennomsnittlig silhuettskår.

Note
Merk

Beregning av WCSS og silhuettskårer for hierarkisk klynging kan være beregningstungt, spesielt for store datasett.

Når du velger antall klynger, bør også din forståelse av dataene og problemet du prøver å løse veilede valget ditt.

question mark

Hvilken av følgende metoder brukes ofte for å bestemme antall klynger i hierarkisk klynging?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 2
some-alt