Implementering på Dummy-datasett
Sveip for å vise menyen
Som vanlig bruker du følgende biblioteker:
-
sklearnfor å generere dummydata og implementere hierarkisk klynging (AgglomerativeClustering); -
scipyfor å generere og arbeide med dendrogrammet; -
matplotlibfor å visualisere klynger og dendrogrammet; -
numpyfor numeriske operasjoner.
Generering av dummydata
Du kan bruke funksjonen make_blobs() fra scikit-learn til å generere datasett med forskjellig antall klynger og varierende grad av separasjon. Dette hjelper deg å se hvordan hierarkisk klynging fungerer i ulike scenarier.
Den generelle algoritmen er som følger:
-
Instansiering av
AgglomerativeClustering-objektet, der koblingsmetode og andre parametere spesifiseres; -
Modelltilpasning til dataene dine;
-
Uttrekking av klyngeetiketter dersom et bestemt antall klynger er valgt;
-
Visualisering av klyngene (hvis dataene er 2D eller 3D) ved bruk av spredningsdiagrammer;
-
Bruk av SciPy sin
linkagefor å lage koblingsmatrisen og deretter dendrogram for å visualisere dendrogrammet.
Det er også mulig å eksperimentere med ulike koblingsmetoder (f.eks. single, complete, average, Ward's) og observere hvordan de påvirker klyngeinndelingen og strukturen til dendrogrammet.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår