Numero Ottimale di Cluster
A differenza del K-means, il clustering gerarchico non produce direttamente un numero fisso di cluster. Invece, genera una gerarchia. È necessario un metodo per decidere dove tagliare il dendrogramma per ottenere il numero desiderato di cluster.
Metodi per determinare il numero di cluster
Per determinare il numero ottimale di cluster, vengono comunemente utilizzati diversi metodi, tra cui la visualizzazione del dendrogramma, il metodo del gomito e il metodo della silhouette.
Visualizzazione del dendrogramma
Questo metodo consiste nell'ispezionare visivamente il dendrogramma alla ricerca dei più grandi intervalli verticali che non sono attraversati da linee orizzontali. Il numero di cluster può essere dedotto dal numero di linee verticali che questi intervalli comprendono. Tuttavia, questo metodo è soggettivo e si basa fortemente sull'interpretazione visiva.
Metodo del gomito (utilizzando la somma dei quadrati intra-cluster - WCSS)
In questo approccio, si esegue il clustering gerarchico per un intervallo di numeri di cluster e si calcola la WCSS per ciascuno. Tracciando i valori WCSS rispetto al numero di cluster, è possibile identificare un punto di "gomito" nel grafico. Questo punto indica un buon equilibrio tra la minimizzazione della WCSS e l'evitare un numero eccessivo di cluster, in modo simile al metodo del gomito nel K-means.
Metodo della silhouette
Questo metodo consiste nel calcolare i punteggi silhouette per diversi numeri di cluster tagliando il dendrogramma a varie altezze. Il numero ottimale di cluster è quello che corrisponde al punteggio silhouette medio più alto.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 2.94
Numero Ottimale di Cluster
Scorri per mostrare il menu
A differenza del K-means, il clustering gerarchico non produce direttamente un numero fisso di cluster. Invece, genera una gerarchia. È necessario un metodo per decidere dove tagliare il dendrogramma per ottenere il numero desiderato di cluster.
Metodi per determinare il numero di cluster
Per determinare il numero ottimale di cluster, vengono comunemente utilizzati diversi metodi, tra cui la visualizzazione del dendrogramma, il metodo del gomito e il metodo della silhouette.
Visualizzazione del dendrogramma
Questo metodo consiste nell'ispezionare visivamente il dendrogramma alla ricerca dei più grandi intervalli verticali che non sono attraversati da linee orizzontali. Il numero di cluster può essere dedotto dal numero di linee verticali che questi intervalli comprendono. Tuttavia, questo metodo è soggettivo e si basa fortemente sull'interpretazione visiva.
Metodo del gomito (utilizzando la somma dei quadrati intra-cluster - WCSS)
In questo approccio, si esegue il clustering gerarchico per un intervallo di numeri di cluster e si calcola la WCSS per ciascuno. Tracciando i valori WCSS rispetto al numero di cluster, è possibile identificare un punto di "gomito" nel grafico. Questo punto indica un buon equilibrio tra la minimizzazione della WCSS e l'evitare un numero eccessivo di cluster, in modo simile al metodo del gomito nel K-means.
Metodo della silhouette
Questo metodo consiste nel calcolare i punteggi silhouette per diversi numeri di cluster tagliando il dendrogramma a varie altezze. Il numero ottimale di cluster è quello che corrisponde al punteggio silhouette medio più alto.
Grazie per i tuoi commenti!