Summary  
Shows how to perform hierarchical clustering by generating synthetic data, computing linkage matrices with various linkage methods, fitting an AgglomerativeClustering model to extract cluster labels, and visualizing both the clusters and their dendrogram.  

General domain of usage  
Unsupervised machine learning

Zoals gebruikelijk maak je gebruik van de volgende bibliotheken:
- `sklearn` voor het genereren van dummydata en het implementeren van hiërarchische clustering (`AgglomerativeClustering`);

- `scipy` voor het genereren en werken met het dendrogram;

- `matplotlib` voor het visualiseren van de clusters en het dendrogram;

- `numpy` voor numerieke bewerkingen.

## Genereren van Dummydata

Je kunt de functie `make_blobs()` uit `scikit-learn` gebruiken om datasets te genereren met **verschillende aantallen clusters** en **variërende mate van scheiding**. Dit helpt je te zien hoe hiërarchische clustering presteert in verschillende scenario's.

Het algemene algoritme is als volgt:

1.  Instantieer het `AgglomerativeClustering`-object, waarbij je de **linkage-methode** en andere parameters specificeert;

2.  Pas het model toe op je data;

3.  Je kunt **clusterlabels** extraheren als je een specifiek aantal clusters kiest;

4.  Visualiseer de clusters (als de data 2D of 3D is) met behulp van **scatterplots**;

5.  Gebruik SciPy's `linkage` om de **linkage-matrix** te maken en vervolgens **dendrogram** om het dendrogram te visualiseren.


Je kunt ook experimenteren met **verschillende linkage-methoden** (bijv. single, complete, average, Ward's) en observeren hoe deze de clusteringresultaten en de structuur van het dendrogram beïnvloeden.

Welke klasse van `scikit-learn` wordt gebruikt om hiërarchische clustering uit te voeren op een dummy dataset?

Ontdek de kracht van verborgen patronen met unsupervised learning. Beheers de meest invloedrijke clustering-algoritmen, waaronder K-Means, Hiërarchische Clustering, DBSCAN en Gaussian Mixture Models. Leer de kwaliteit van clusters te evalueren met behulp van WSS en Silhouette-scores, verschillende afstandsmaatstaven te hanteren en robuuste oplossingen te implementeren op echte datasets. Ontwikkel vaardigheden om klantsegmentatie uit te voeren en structuren te ontdekken in niet-gelabelde data met Scikit-learn.

Implementatie op Dummy Dataset

Genereren van Dummydata

Implementatie op Dummy Dataset

Genereren van Dummydata