Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Implementering på Dummy-Datasæt | Hierarkisk Klyngedannelse
Klyngeanalyse

bookImplementering på Dummy-Datasæt

Som sædvanligt anvendes følgende biblioteker:

  • sklearn til generering af dummy-data og implementering af hierarkisk klyngedannelse (AgglomerativeClustering);

  • scipy til generering og håndtering af dendrogrammet;

  • matplotlib til visualisering af klynger og dendrogrammet;

  • numpy til numeriske operationer.

Generering af dummy-data

Funktionen make_blobs() fra scikit-learn kan anvendes til at generere datasæt med forskellige antal klynger og varierende grader af adskillelse. Dette hjælper med at illustrere, hvordan hierarkisk klyngedannelse fungerer under forskellige forhold.

Den generelle algoritme er som følger:

  1. Instantiér et AgglomerativeClustering-objekt, hvor du angiver linkage-metode og andre parametre;

  2. Tilpas modellen til dine data;

  3. Ekstrahér klyngeetiketter, hvis du vælger et bestemt antal klynger;

  4. Visualisér klyngerne (hvis dataene er 2D eller 3D) ved hjælp af spredningsdiagrammer;

  5. Brug SciPy's linkage til at oprette linkage-matrixen og derefter dendrogram til at visualisere dendrogrammet.

Det er også muligt at eksperimentere med forskellige linkage-metoder (f.eks. single, complete, average, Ward's) og observere, hvordan de påvirker klyngeresultaterne og dendrogrammets struktur.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 3

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 2.94

bookImplementering på Dummy-Datasæt

Stryg for at vise menuen

Som sædvanligt anvendes følgende biblioteker:

  • sklearn til generering af dummy-data og implementering af hierarkisk klyngedannelse (AgglomerativeClustering);

  • scipy til generering og håndtering af dendrogrammet;

  • matplotlib til visualisering af klynger og dendrogrammet;

  • numpy til numeriske operationer.

Generering af dummy-data

Funktionen make_blobs() fra scikit-learn kan anvendes til at generere datasæt med forskellige antal klynger og varierende grader af adskillelse. Dette hjælper med at illustrere, hvordan hierarkisk klyngedannelse fungerer under forskellige forhold.

Den generelle algoritme er som følger:

  1. Instantiér et AgglomerativeClustering-objekt, hvor du angiver linkage-metode og andre parametre;

  2. Tilpas modellen til dine data;

  3. Ekstrahér klyngeetiketter, hvis du vælger et bestemt antal klynger;

  4. Visualisér klyngerne (hvis dataene er 2D eller 3D) ved hjælp af spredningsdiagrammer;

  5. Brug SciPy's linkage til at oprette linkage-matrixen og derefter dendrogram til at visualisere dendrogrammet.

Det er også muligt at eksperimentere med forskellige linkage-metoder (f.eks. single, complete, average, Ward's) og observere, hvordan de påvirker klyngeresultaterne og dendrogrammets struktur.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 3
some-alt