Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Finne Optimalt Antall Klynger ved Bruk av Silhuett-score | K-Means
Klyngeanalyse

bookFinne Optimalt Antall Klynger ved Bruk av Silhuett-score

I tillegg til WSS-metoden er silhuettskåren en annen verdifull metrikk for å bestemme det optimale antallet klynger (K) i K-means. Den vurderer hvor godt hvert datapunkt passer i sin klynge sammenlignet med andre.

For hvert datapunkt tar silhuettskåren hensyn til:

  • Kohesjon (a): gjennomsnittlig avstand til punkter innenfor samme klynge;

  • Separasjon (b): gjennomsnittlig avstand til punkter i nærmeste andre klynge.

Silhuettskåren beregnes som: (b - a) / max(a, b), og varierer fra -1 til +1.

Tolkning av skår:

  • +1: punktet er godt gruppert;

  • ~0: punktet ligger på grensen mellom klynger;

  • -1: punktet kan være feilklassifisert.

Fremgangsmåte for å finne optimal K ved bruk av silhuettskår er følgende:

  • Kjør K-means for et utvalg av K-verdier (f.eks. K=2 til et rimelig maksimum);

  • For hver K, beregn gjennomsnittlig silhuettskår;

  • Plott gjennomsnittlig silhuettskår mot K (silhuettplot);

  • Velg K med høyest gjennomsnittlig silhuettskår.

Ved å undersøke silhuettplottet, som viser skårer for hvert punkt, kan man få dypere innsikt i klyngekonsistens. Høyere gjennomsnittsskårer og jevne skårer på tvers av punkter er ønskelig.

Oppsummert: Mens WSS minimerer avstander innenfor klynger, balanserer silhuettskåren kohesjon og separasjon. Å bruke begge gir en mer robust tilnærming til å finne optimal K.

question mark

Hva indikerer en høy gjennomsnittlig silhuettscore (nær +1) ved evaluering av klyngeanalyse-resultater?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 2.94

bookFinne Optimalt Antall Klynger ved Bruk av Silhuett-score

Sveip for å vise menyen

I tillegg til WSS-metoden er silhuettskåren en annen verdifull metrikk for å bestemme det optimale antallet klynger (K) i K-means. Den vurderer hvor godt hvert datapunkt passer i sin klynge sammenlignet med andre.

For hvert datapunkt tar silhuettskåren hensyn til:

  • Kohesjon (a): gjennomsnittlig avstand til punkter innenfor samme klynge;

  • Separasjon (b): gjennomsnittlig avstand til punkter i nærmeste andre klynge.

Silhuettskåren beregnes som: (b - a) / max(a, b), og varierer fra -1 til +1.

Tolkning av skår:

  • +1: punktet er godt gruppert;

  • ~0: punktet ligger på grensen mellom klynger;

  • -1: punktet kan være feilklassifisert.

Fremgangsmåte for å finne optimal K ved bruk av silhuettskår er følgende:

  • Kjør K-means for et utvalg av K-verdier (f.eks. K=2 til et rimelig maksimum);

  • For hver K, beregn gjennomsnittlig silhuettskår;

  • Plott gjennomsnittlig silhuettskår mot K (silhuettplot);

  • Velg K med høyest gjennomsnittlig silhuettskår.

Ved å undersøke silhuettplottet, som viser skårer for hvert punkt, kan man få dypere innsikt i klyngekonsistens. Høyere gjennomsnittsskårer og jevne skårer på tvers av punkter er ønskelig.

Oppsummert: Mens WSS minimerer avstander innenfor klynger, balanserer silhuettskåren kohesjon og separasjon. Å bruke begge gir en mer robust tilnærming til å finne optimal K.

question mark

Hva indikerer en høy gjennomsnittlig silhuettscore (nær +1) ved evaluering av klyngeanalyse-resultater?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4
some-alt