Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Implementering på Dummy-datasæt | Hierarkisk Klyngedannelse
Klyngeanalyse med Python

Implementering på Dummy-datasæt

Stryg for at vise menuen

Som sædvanligt bruges følgende biblioteker:

  • sklearn til generering af dummydata og implementering af hierarkisk klyngedannelse (AgglomerativeClustering);

  • scipy til generering og håndtering af dendrogrammet;

  • matplotlib til visualisering af klynger og dendrogrammet;

  • numpy til numeriske operationer.

Generering af dummydata

Funktionen make_blobs() fra scikit-learn kan bruges til at generere datasæt med forskelligt antal klynger og varierende grader af adskillelse. Dette hjælper med at illustrere, hvordan hierarkisk klyngedannelse fungerer under forskellige forhold.

Dummydata

Den generelle algoritme er som følger:

  1. Instansiering af AgglomerativeClustering-objektet, hvor linkage-metode og andre parametre angives;

  2. Modellens tilpasning til dataene;

  3. Udtrækning af klyngeetiketter, hvis et specifikt antal klynger vælges;

  4. Visualisering af klyngerne (hvis dataene er 2D eller 3D) ved brug af spredningsdiagrammer;

  5. Anvendelse af SciPy's linkage til at oprette linkage-matrixen og derefter dendrogram for at visualisere dendrogrammet.

Der kan også eksperimenteres med forskellige linkage-metoder (f.eks. single, complete, average, Ward's) og observeres, hvordan de påvirker klyngeresultaterne og dendrogrammets struktur.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 3

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 4. Kapitel 3
some-alt