Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Implementering på Dummy-datasett | Hierarkisk Klynging
Klyngeanalyse med Python

Implementering på Dummy-datasett

Sveip for å vise menyen

Som vanlig bruker du følgende biblioteker:

  • sklearn for å generere dummydata og implementere hierarkisk klynging (AgglomerativeClustering);

  • scipy for å generere og arbeide med dendrogrammet;

  • matplotlib for å visualisere klynger og dendrogrammet;

  • numpy for numeriske operasjoner.

Generering av dummydata

Du kan bruke funksjonen make_blobs() fra scikit-learn til å generere datasett med forskjellig antall klynger og varierende grad av separasjon. Dette hjelper deg å se hvordan hierarkisk klynging fungerer i ulike scenarier.

Dummydata

Den generelle algoritmen er som følger:

  1. Instansiering av AgglomerativeClustering-objektet, der koblingsmetode og andre parametere spesifiseres;

  2. Modelltilpasning til dataene dine;

  3. Uttrekking av klyngeetiketter dersom et bestemt antall klynger er valgt;

  4. Visualisering av klyngene (hvis dataene er 2D eller 3D) ved bruk av spredningsdiagrammer;

  5. Bruk av SciPy sin linkage for å lage koblingsmatrisen og deretter dendrogram for å visualisere dendrogrammet.

Det er også mulig å eksperimentere med ulike koblingsmetoder (f.eks. single, complete, average, Ward's) og observere hvordan de påvirker klyngeinndelingen og strukturen til dendrogrammet.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 3

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 4. Kapittel 3
some-alt