Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Finne Optimalt Antall Klynger ved Bruk av Silhuett-Score | K-Means
Quizzes & Challenges
Quizzes
Challenges
/
Klyngeanalyse med Python

bookFinne Optimalt Antall Klynger ved Bruk av Silhuett-Score

I tillegg til WSS-metoden er silhuettskåren et annet verdifullt mål for å bestemme det optimale antallet klynger (K) i K-means. Den vurderer hvor godt hvert datapunkt passer i sin klynge sammenlignet med andre.

For hvert datapunkt tar silhuettskåren hensyn til:

  • Kohesjon (a): gjennomsnittlig avstand til punkter innenfor samme klynge;

  • Separasjon (b): gjennomsnittlig avstand til punkter i nærmeste andre klynge.

Silhuettskåren beregnes som: (b - a) / max(a, b), og varierer fra -1 til +1.

Tolkning av skår:

  • +1: punktet er godt gruppert;

  • ~0: punktet ligger på klyngegrensen;

  • -1: punktet kan være feilklassifisert.

Fremgangsmåte for å finne optimal K ved bruk av silhuettskår:

  • Kjør K-means for et utvalg av K-verdier (f.eks. K=2 til en rimelig grense);

  • For hver K, beregn gjennomsnittlig silhuettskår;

  • Plott gjennomsnittlig silhuettskår mot K (silhuettplot);

  • Velg K med høyest gjennomsnittlig silhuettskår.

Ved å undersøke silhuettplottet, som viser skårer for hvert punkt, kan man få dypere innsikt i klyngekonsistens. Høyere gjennomsnittsskårer og jevne skårer på tvers av punkter er ønskelig.

Oppsummert: Mens WSS minimerer innenfor-klynge-avstander, balanserer silhuettskåren kohesjon og separasjon. Å bruke begge gir en mer robust tilnærming til å finne optimal K.

question mark

Hva indikerer en høy gjennomsnittlig silhuettscore (nær +1) ved evaluering av klyngeanalyse-resultater?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 2.94

bookFinne Optimalt Antall Klynger ved Bruk av Silhuett-Score

Sveip for å vise menyen

I tillegg til WSS-metoden er silhuettskåren et annet verdifullt mål for å bestemme det optimale antallet klynger (K) i K-means. Den vurderer hvor godt hvert datapunkt passer i sin klynge sammenlignet med andre.

For hvert datapunkt tar silhuettskåren hensyn til:

  • Kohesjon (a): gjennomsnittlig avstand til punkter innenfor samme klynge;

  • Separasjon (b): gjennomsnittlig avstand til punkter i nærmeste andre klynge.

Silhuettskåren beregnes som: (b - a) / max(a, b), og varierer fra -1 til +1.

Tolkning av skår:

  • +1: punktet er godt gruppert;

  • ~0: punktet ligger på klyngegrensen;

  • -1: punktet kan være feilklassifisert.

Fremgangsmåte for å finne optimal K ved bruk av silhuettskår:

  • Kjør K-means for et utvalg av K-verdier (f.eks. K=2 til en rimelig grense);

  • For hver K, beregn gjennomsnittlig silhuettskår;

  • Plott gjennomsnittlig silhuettskår mot K (silhuettplot);

  • Velg K med høyest gjennomsnittlig silhuettskår.

Ved å undersøke silhuettplottet, som viser skårer for hvert punkt, kan man få dypere innsikt i klyngekonsistens. Høyere gjennomsnittsskårer og jevne skårer på tvers av punkter er ønskelig.

Oppsummert: Mens WSS minimerer innenfor-klynge-avstander, balanserer silhuettskåren kohesjon og separasjon. Å bruke begge gir en mer robust tilnærming til å finne optimal K.

question mark

Hva indikerer en høy gjennomsnittlig silhuettscore (nær +1) ved evaluering av klyngeanalyse-resultater?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4
some-alt