Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Implementering på Dummy-Datasæt | Sektion
Practice
Projects
Quizzes & Challenges
Quizzer
Challenges
/
Grundlæggende Ikke-Superviseret Læring

bookImplementering på Dummy-Datasæt

Som sædvanligt anvendes følgende biblioteker:

  • sklearn til generering af dummy-data og implementering af hierarkisk klyngedannelse (AgglomerativeClustering);

  • scipy til generering og håndtering af dendrogrammet;

  • matplotlib til visualisering af klynger og dendrogram;

  • numpy til numeriske operationer.

Generering af dummy-data

Funktionen make_blobs() fra scikit-learn kan anvendes til at generere datasæt med forskellige antal klynger og varierende grader af separation. Dette muliggør observation af, hvordan hierarkisk klyngedannelse præsterer under forskellige scenarier.

Den generelle algoritme er som følger:

  1. Instantiér AgglomerativeClustering-objektet, hvor linkage-metode og andre parametre angives;

  2. Tilpas modellen til dataene;

  3. Ekstrahér klyngeetiketter, hvis et specifikt antal klynger vælges;

  4. Visualisér klyngerne (hvis dataene er 2D eller 3D) ved hjælp af spredningsdiagrammer;

  5. Anvend SciPy's linkage til at oprette linkage-matrixen og derefter dendrogram for at visualisere dendrogrammet.

Det er også muligt at eksperimentere med forskellige linkage-metoder (f.eks. single, complete, average, Ward's) og observere, hvordan de påvirker klyngeresultaterne og dendrogrammets struktur.

question mark

Hvilken klasse fra scikit-learn anvendes til at udføre hierarkisk klyngedannelse på et dummy-datasæt?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 16

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

bookImplementering på Dummy-Datasæt

Stryg for at vise menuen

Som sædvanligt anvendes følgende biblioteker:

  • sklearn til generering af dummy-data og implementering af hierarkisk klyngedannelse (AgglomerativeClustering);

  • scipy til generering og håndtering af dendrogrammet;

  • matplotlib til visualisering af klynger og dendrogram;

  • numpy til numeriske operationer.

Generering af dummy-data

Funktionen make_blobs() fra scikit-learn kan anvendes til at generere datasæt med forskellige antal klynger og varierende grader af separation. Dette muliggør observation af, hvordan hierarkisk klyngedannelse præsterer under forskellige scenarier.

Den generelle algoritme er som følger:

  1. Instantiér AgglomerativeClustering-objektet, hvor linkage-metode og andre parametre angives;

  2. Tilpas modellen til dataene;

  3. Ekstrahér klyngeetiketter, hvis et specifikt antal klynger vælges;

  4. Visualisér klyngerne (hvis dataene er 2D eller 3D) ved hjælp af spredningsdiagrammer;

  5. Anvend SciPy's linkage til at oprette linkage-matrixen og derefter dendrogram for at visualisere dendrogrammet.

Det er også muligt at eksperimentere med forskellige linkage-metoder (f.eks. single, complete, average, Ward's) og observere, hvordan de påvirker klyngeresultaterne og dendrogrammets struktur.

question mark

Hvilken klasse fra scikit-learn anvendes til at udføre hierarkisk klyngedannelse på et dummy-datasæt?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 16
some-alt