Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Finne Optimalt Antall Klynger ved Bruk av Silhuettscore | Seksjon
Grunnleggende Usupervisert Læring

bookFinne Optimalt Antall Klynger ved Bruk av Silhuettscore

I tillegg til WSS-metoden er silhuettskåren et annet verdifullt mål for å bestemme det optimale antallet klynger (K) i K-means. Den vurderer hvor godt hvert datapunkt passer i sin klynge sammenlignet med andre.

For hvert datapunkt vurderer silhuettskåren:

  • Kohesjon (a): gjennomsnittlig avstand til punkter innenfor samme klynge;

  • Separasjon (b): gjennomsnittlig avstand til punkter i nærmeste andre klynge.

Silhuettskåren beregnes som: (b - a) / max(a, b), og varierer fra -1 til +1.

Tolkning av skår:

  • +1: punktet er godt gruppert;

  • ~0: punktet ligger på klyngegrensen;

  • -1: punktet kan være feilklassifisert.

Fremgangsmåte for å finne optimal K ved bruk av silhuettskår:

  • Kjør K-means for et utvalg av K-verdier (f.eks. K=2 til en rimelig grense);

  • Beregn gjennomsnittlig silhuettskår for hver K;

  • Plott gjennomsnittlig silhuettskår mot K (silhuettplot);

  • Velg K med høyest gjennomsnittlig silhuettskår.

Ved å undersøke silhuettplottet, som viser skårer for hvert punkt, kan man få dypere innsikt i klyngekonsistens. Høyere gjennomsnittsskårer og jevne skårer på tvers av punkter er ønskelig.

Oppsummert: Mens WSS minimerer avstander innenfor klynger, balanserer silhuettskåren kohesjon og separasjon. Å bruke begge gir en mer robust tilnærming til å finne optimal K.

question mark

Hva indikerer en høy gjennomsnittlig silhuettscore (nær +1) ved evaluering av klyngeanalyse?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

bookFinne Optimalt Antall Klynger ved Bruk av Silhuettscore

Sveip for å vise menyen

I tillegg til WSS-metoden er silhuettskåren et annet verdifullt mål for å bestemme det optimale antallet klynger (K) i K-means. Den vurderer hvor godt hvert datapunkt passer i sin klynge sammenlignet med andre.

For hvert datapunkt vurderer silhuettskåren:

  • Kohesjon (a): gjennomsnittlig avstand til punkter innenfor samme klynge;

  • Separasjon (b): gjennomsnittlig avstand til punkter i nærmeste andre klynge.

Silhuettskåren beregnes som: (b - a) / max(a, b), og varierer fra -1 til +1.

Tolkning av skår:

  • +1: punktet er godt gruppert;

  • ~0: punktet ligger på klyngegrensen;

  • -1: punktet kan være feilklassifisert.

Fremgangsmåte for å finne optimal K ved bruk av silhuettskår:

  • Kjør K-means for et utvalg av K-verdier (f.eks. K=2 til en rimelig grense);

  • Beregn gjennomsnittlig silhuettskår for hver K;

  • Plott gjennomsnittlig silhuettskår mot K (silhuettplot);

  • Velg K med høyest gjennomsnittlig silhuettskår.

Ved å undersøke silhuettplottet, som viser skårer for hvert punkt, kan man få dypere innsikt i klyngekonsistens. Høyere gjennomsnittsskårer og jevne skårer på tvers av punkter er ønskelig.

Oppsummert: Mens WSS minimerer avstander innenfor klynger, balanserer silhuettskåren kohesjon og separasjon. Å bruke begge gir en mer robust tilnærming til å finne optimal K.

question mark

Hva indikerer en høy gjennomsnittlig silhuettscore (nær +1) ved evaluering av klyngeanalyse?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10
some-alt