Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Numero Ottimale di Cluster | Sezione
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Fondamenti di Apprendimento Non Supervisionato

bookNumero Ottimale di Cluster

A differenza del K-means, il clustering gerarchico non produce direttamente un numero fisso di cluster. Invece, genera una gerarchia. È necessario un metodo per decidere dove tagliare il dendrogramma per ottenere il numero desiderato di cluster.

Metodi per Determinare il Numero di Cluster

Per determinare il numero ottimale di cluster, vengono comunemente utilizzati diversi metodi, tra cui la visualizzazione del dendrogramma, il metodo del gomito e il metodo della silhouette.

Visualizzazione del Dendrogramma

Questo metodo consiste nell'ispezionare visivamente il dendrogramma alla ricerca dei più grandi intervalli verticali che non sono intersecati da linee orizzontali. Il numero di cluster può essere dedotto dal numero di linee verticali che questi intervalli comprendono. Tuttavia, questo metodo è soggettivo e si basa fortemente sull'interpretazione visiva.

Metodo del Gomito (utilizzando la somma dei quadrati intra-cluster - WCSS)

In questo approccio, si esegue il clustering gerarchico per un intervallo di numeri di cluster e si calcola la WCSS per ciascuno. Tracciando i valori di WCSS rispetto al numero di cluster, è possibile identificare un punto di "gomito" nel grafico. Questo punto indica un buon equilibrio tra la minimizzazione della WCSS e l'evitare un numero eccessivo di cluster, in modo simile al metodo del gomito nel K-means.

Metodo della Silhouette

Questo metodo prevede il calcolo dei punteggi silhouette per diversi numeri di cluster tagliando il dendrogramma a varie altezze. Il numero ottimale di cluster è quello che corrisponde al punteggio silhouette medio più alto.

Note
Nota

Il calcolo della WCSS e dei punteggi silhouette per il clustering gerarchico può essere computazionalmente oneroso, specialmente per dataset di grandi dimensioni.

Nella scelta del numero di cluster, anche la comprensione dei dati e del problema da risolvere dovrebbe guidare la decisione.

question mark

Quale dei seguenti è un metodo comunemente utilizzato per determinare il numero di cluster nel clustering gerarchico?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 15

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

bookNumero Ottimale di Cluster

Scorri per mostrare il menu

A differenza del K-means, il clustering gerarchico non produce direttamente un numero fisso di cluster. Invece, genera una gerarchia. È necessario un metodo per decidere dove tagliare il dendrogramma per ottenere il numero desiderato di cluster.

Metodi per Determinare il Numero di Cluster

Per determinare il numero ottimale di cluster, vengono comunemente utilizzati diversi metodi, tra cui la visualizzazione del dendrogramma, il metodo del gomito e il metodo della silhouette.

Visualizzazione del Dendrogramma

Questo metodo consiste nell'ispezionare visivamente il dendrogramma alla ricerca dei più grandi intervalli verticali che non sono intersecati da linee orizzontali. Il numero di cluster può essere dedotto dal numero di linee verticali che questi intervalli comprendono. Tuttavia, questo metodo è soggettivo e si basa fortemente sull'interpretazione visiva.

Metodo del Gomito (utilizzando la somma dei quadrati intra-cluster - WCSS)

In questo approccio, si esegue il clustering gerarchico per un intervallo di numeri di cluster e si calcola la WCSS per ciascuno. Tracciando i valori di WCSS rispetto al numero di cluster, è possibile identificare un punto di "gomito" nel grafico. Questo punto indica un buon equilibrio tra la minimizzazione della WCSS e l'evitare un numero eccessivo di cluster, in modo simile al metodo del gomito nel K-means.

Metodo della Silhouette

Questo metodo prevede il calcolo dei punteggi silhouette per diversi numeri di cluster tagliando il dendrogramma a varie altezze. Il numero ottimale di cluster è quello che corrisponde al punteggio silhouette medio più alto.

Note
Nota

Il calcolo della WCSS e dei punteggi silhouette per il clustering gerarchico può essere computazionalmente oneroso, specialmente per dataset di grandi dimensioni.

Nella scelta del numero di cluster, anche la comprensione dei dati e del problema da risolvere dovrebbe guidare la decisione.

question mark

Quale dei seguenti è un metodo comunemente utilizzato per determinare il numero di cluster nel clustering gerarchico?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 15
some-alt