Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Implementatie op Dummy Dataset | Sectie
Essentiële Unsupervised Learning

bookImplementatie op Dummy Dataset

Zoals gebruikelijk maak je gebruik van de volgende bibliotheken:

  • sklearn voor het genereren van dummydata en het implementeren van hiërarchische clustering (AgglomerativeClustering);

  • scipy voor het genereren en werken met het dendrogram;

  • matplotlib voor het visualiseren van de clusters en het dendrogram;

  • numpy voor numerieke bewerkingen.

Genereren van Dummydata

Je kunt de functie make_blobs() uit scikit-learn gebruiken om datasets te genereren met verschillende aantallen clusters en variërende mate van scheiding. Dit helpt je te zien hoe hiërarchische clustering presteert in verschillende scenario's.

Het algemene algoritme is als volgt:

  1. Instantieer het AgglomerativeClustering-object, waarbij je de linkage-methode en andere parameters specificeert;

  2. Pas het model toe op je data;

  3. Je kunt clusterlabels extraheren als je een specifiek aantal clusters kiest;

  4. Visualiseer de clusters (als de data 2D of 3D is) met behulp van scatterplots;

  5. Gebruik SciPy's linkage om de linkage-matrix te maken en vervolgens dendrogram om het dendrogram te visualiseren.

Je kunt ook experimenteren met verschillende linkage-methoden (bijv. single, complete, average, Ward's) en observeren hoe deze de clusteringresultaten en de structuur van het dendrogram beïnvloeden.

question mark

Welke klasse van scikit-learn wordt gebruikt om hiërarchische clustering uit te voeren op een dummy dataset?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 16

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

bookImplementatie op Dummy Dataset

Veeg om het menu te tonen

Zoals gebruikelijk maak je gebruik van de volgende bibliotheken:

  • sklearn voor het genereren van dummydata en het implementeren van hiërarchische clustering (AgglomerativeClustering);

  • scipy voor het genereren en werken met het dendrogram;

  • matplotlib voor het visualiseren van de clusters en het dendrogram;

  • numpy voor numerieke bewerkingen.

Genereren van Dummydata

Je kunt de functie make_blobs() uit scikit-learn gebruiken om datasets te genereren met verschillende aantallen clusters en variërende mate van scheiding. Dit helpt je te zien hoe hiërarchische clustering presteert in verschillende scenario's.

Het algemene algoritme is als volgt:

  1. Instantieer het AgglomerativeClustering-object, waarbij je de linkage-methode en andere parameters specificeert;

  2. Pas het model toe op je data;

  3. Je kunt clusterlabels extraheren als je een specifiek aantal clusters kiest;

  4. Visualiseer de clusters (als de data 2D of 3D is) met behulp van scatterplots;

  5. Gebruik SciPy's linkage om de linkage-matrix te maken en vervolgens dendrogram om het dendrogram te visualiseren.

Je kunt ook experimenteren met verschillende linkage-methoden (bijv. single, complete, average, Ward's) en observeren hoe deze de clusteringresultaten en de structuur van het dendrogram beïnvloeden.

question mark

Welke klasse van scikit-learn wordt gebruikt om hiërarchische clustering uit te voeren op een dummy dataset?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 16
some-alt