Hvordan Hierarkisk Klynging Fungerer
Hierarkisk klynging er en metode for klyngeanalyse som har som mål å bygge et hierarki av klynger. I motsetning til K-means krever den ikke at du forhåndsdefinerer antall klynger.
Algoritmen kan enten starte med hver observasjon i sin egen klynge og deretter gradvis slå dem sammen (agglomerativ klynging), eller starte med alle observasjoner i én klynge og deretter dele dem opp i mindre klynger (divisiv klynging).
Siden agglomerativ klynging er den mest brukte tilnærmingen, vil vi fokusere på denne.
Den vanligste typen hierarkisk klynging er bottom-up-tilnærmingen. Algoritmen er som følger:
-
Initialisering: hver datapunkt behandles som en egen klynge;
-
Beregn nærhetsmatrise: beregn avstanden mellom hvert par av klynger;
-
Slå sammen klynger: de to nærmeste klyngene slås sammen til én klynge;
-
Oppdater nærhetsmatrise: beregn avstandene på nytt mellom den nye klyngen og alle gjenværende klynger;
-
Gjenta: trinn 3 og 4 gjentas til alle datapunktene er slått sammen til én klynge.
Koblingstyper
Nærheten mellom to klynger defineres av koblingstypen. Vanlige koblingsmetoder brukt i hierarkisk klynging er:
-
Enkeltkobling: avstanden mellom de nærmeste to punktene i de to klyngene;
-
Fullkobling: avstanden mellom de fjerneste to punktene i de to klyngene;
-
Gjennomsnittskobling: gjennomsnittlig avstand mellom alle punktpar i de to klyngene;
-
Wards metode: minimerer økningen i total varians innenfor klyngene når to klynger slås sammen.
Valg av koblingsmetode kan påvirke formen og strukturen til de resulterende klyngene. Eksperimentering og domenekunnskap er ofte nyttig for å velge den beste metoden for dine data.
Dendrogram
Resultatene av hierarkisk klynging visualiseres ofte ved hjelp av et dendrogram.
Et dendrogram er et trelignende diagram som viser det hierarkiske forholdet mellom klyngene. Høyden på grenene i dendrogrammet representerer avstanden mellom klyngene.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 3.23
Hvordan Hierarkisk Klynging Fungerer
Sveip for å vise menyen
Hierarkisk klynging er en metode for klyngeanalyse som har som mål å bygge et hierarki av klynger. I motsetning til K-means krever den ikke at du forhåndsdefinerer antall klynger.
Algoritmen kan enten starte med hver observasjon i sin egen klynge og deretter gradvis slå dem sammen (agglomerativ klynging), eller starte med alle observasjoner i én klynge og deretter dele dem opp i mindre klynger (divisiv klynging).
Siden agglomerativ klynging er den mest brukte tilnærmingen, vil vi fokusere på denne.
Den vanligste typen hierarkisk klynging er bottom-up-tilnærmingen. Algoritmen er som følger:
-
Initialisering: hver datapunkt behandles som en egen klynge;
-
Beregn nærhetsmatrise: beregn avstanden mellom hvert par av klynger;
-
Slå sammen klynger: de to nærmeste klyngene slås sammen til én klynge;
-
Oppdater nærhetsmatrise: beregn avstandene på nytt mellom den nye klyngen og alle gjenværende klynger;
-
Gjenta: trinn 3 og 4 gjentas til alle datapunktene er slått sammen til én klynge.
Koblingstyper
Nærheten mellom to klynger defineres av koblingstypen. Vanlige koblingsmetoder brukt i hierarkisk klynging er:
-
Enkeltkobling: avstanden mellom de nærmeste to punktene i de to klyngene;
-
Fullkobling: avstanden mellom de fjerneste to punktene i de to klyngene;
-
Gjennomsnittskobling: gjennomsnittlig avstand mellom alle punktpar i de to klyngene;
-
Wards metode: minimerer økningen i total varians innenfor klyngene når to klynger slås sammen.
Valg av koblingsmetode kan påvirke formen og strukturen til de resulterende klyngene. Eksperimentering og domenekunnskap er ofte nyttig for å velge den beste metoden for dine data.
Dendrogram
Resultatene av hierarkisk klynging visualiseres ofte ved hjelp av et dendrogram.
Et dendrogram er et trelignende diagram som viser det hierarkiske forholdet mellom klyngene. Høyden på grenene i dendrogrammet representerer avstanden mellom klyngene.
Takk for tilbakemeldingene dine!