Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Optimale Aantal Clusters | Hiërarchische Clustering
Clusteranalyse

bookOptimale Aantal Clusters

In tegenstelling tot K-means levert hiërarchische clustering niet direct een vast aantal clusters op. In plaats daarvan ontstaat er een hiërarchie. Er is een methode nodig om te bepalen waar je de dendrogram moet doorsnijden om het gewenste aantal clusters te verkrijgen.

Methoden om het aantal clusters te bepalen

Om het optimale aantal clusters te bepalen, worden verschillende methoden vaak gebruikt, waaronder dendrogramvisualisatie, de elbow-methode en de silhouette-methode.

Dendrogramvisualisatie

Deze methode houdt in dat je het dendrogram visueel inspecteert op de grootste verticale gaten die niet worden doorkruist door horizontale lijnen. Het aantal clusters kan worden afgeleid uit het aantal verticale lijnen dat deze gaten omvat. Deze methode is echter subjectief en hangt sterk af van visuele interpretatie.

Elbow-methode (gebruikmakend van within-cluster sum of squares - WCSS)

Bij deze aanpak voer je hiërarchische clustering uit voor een reeks aantallen clusters en bereken je de WCSS voor elk. Door de WCSS-waarden uit te zetten tegen het aantal clusters, kun je een "knikpunt" in de grafiek identificeren. Dit punt geeft een goed evenwicht aan tussen het minimaliseren van WCSS en het vermijden van een overmatig aantal clusters, vergelijkbaar met de elbow-methode bij K-means.

Silhouette-methode

Deze methode houdt in dat je silhouette-scores berekent voor verschillende aantallen clusters door het dendrogram op verschillende hoogtes te doorsnijden. Het optimale aantal clusters is het aantal dat overeenkomt met de hoogste gemiddelde silhouette-score.

question mark

Welke van de volgende is een veelgebruikte methode om het aantal clusters te bepalen bij hiërarchische clustering?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 2

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 2.94

bookOptimale Aantal Clusters

Veeg om het menu te tonen

In tegenstelling tot K-means levert hiërarchische clustering niet direct een vast aantal clusters op. In plaats daarvan ontstaat er een hiërarchie. Er is een methode nodig om te bepalen waar je de dendrogram moet doorsnijden om het gewenste aantal clusters te verkrijgen.

Methoden om het aantal clusters te bepalen

Om het optimale aantal clusters te bepalen, worden verschillende methoden vaak gebruikt, waaronder dendrogramvisualisatie, de elbow-methode en de silhouette-methode.

Dendrogramvisualisatie

Deze methode houdt in dat je het dendrogram visueel inspecteert op de grootste verticale gaten die niet worden doorkruist door horizontale lijnen. Het aantal clusters kan worden afgeleid uit het aantal verticale lijnen dat deze gaten omvat. Deze methode is echter subjectief en hangt sterk af van visuele interpretatie.

Elbow-methode (gebruikmakend van within-cluster sum of squares - WCSS)

Bij deze aanpak voer je hiërarchische clustering uit voor een reeks aantallen clusters en bereken je de WCSS voor elk. Door de WCSS-waarden uit te zetten tegen het aantal clusters, kun je een "knikpunt" in de grafiek identificeren. Dit punt geeft een goed evenwicht aan tussen het minimaliseren van WCSS en het vermijden van een overmatig aantal clusters, vergelijkbaar met de elbow-methode bij K-means.

Silhouette-methode

Deze methode houdt in dat je silhouette-scores berekent voor verschillende aantallen clusters door het dendrogram op verschillende hoogtes te doorsnijden. Het optimale aantal clusters is het aantal dat overeenkomt met de hoogste gemiddelde silhouette-score.

question mark

Welke van de volgende is een veelgebruikte methode om het aantal clusters te bepalen bij hiërarchische clustering?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 2
some-alt