Como Funciona a Clusterização Hierárquica?
O algoritmo pode começar com cada ponto em seu próprio cluster e sucessivamente agrupá-los (agrupamento aglomerativo), ou começar com todos os pontos em um único cluster e dividi-los recursivamente em clusters menores (agrupamento divisivo).
Como o agrupamento aglomerativo é a abordagem mais utilizada, focaremos nela.
O tipo mais comum de agrupamento hierárquico é a abordagem bottom-up. O algoritmo segue os seguintes passos:
-
Inicialização: cada ponto de dados é tratado como um único cluster;
-
Calcular matriz de proximidade: calcular a distância entre cada par de clusters;
-
Unir clusters: os dois clusters mais próximos são unidos em um único cluster;
-
Atualizar matriz de proximidade: recalcular as distâncias entre o novo cluster e todos os clusters restantes;
-
Repetir: os passos 3 e 4 são repetidos até que todos os pontos de dados estejam agrupados em um único cluster.
Tipos de Ligação
A proximidade entre dois clusters é definida pelo tipo de ligação. Métodos de ligação comuns utilizados no agrupamento hierárquico incluem:
-
Ligação simples: distância entre os dois pontos mais próximos nos dois clusters;
-
Ligação completa: distância entre os dois pontos mais distantes nos dois clusters;
-
Ligação média: distância média entre todos os pares de pontos nos dois clusters;
-
Método de Ward: minimiza o aumento da variância total dentro do cluster ao unir dois clusters.
A escolha do método de ligação pode impactar a forma e a estrutura dos clusters resultantes. Experimentação e conhecimento do domínio frequentemente auxiliam na seleção do melhor método para seus dados.
Dendrograma
Os resultados da clusterização hierárquica são frequentemente visualizados utilizando um dendrograma.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 2.94
Como Funciona a Clusterização Hierárquica?
Deslize para mostrar o menu
O algoritmo pode começar com cada ponto em seu próprio cluster e sucessivamente agrupá-los (agrupamento aglomerativo), ou começar com todos os pontos em um único cluster e dividi-los recursivamente em clusters menores (agrupamento divisivo).
Como o agrupamento aglomerativo é a abordagem mais utilizada, focaremos nela.
O tipo mais comum de agrupamento hierárquico é a abordagem bottom-up. O algoritmo segue os seguintes passos:
-
Inicialização: cada ponto de dados é tratado como um único cluster;
-
Calcular matriz de proximidade: calcular a distância entre cada par de clusters;
-
Unir clusters: os dois clusters mais próximos são unidos em um único cluster;
-
Atualizar matriz de proximidade: recalcular as distâncias entre o novo cluster e todos os clusters restantes;
-
Repetir: os passos 3 e 4 são repetidos até que todos os pontos de dados estejam agrupados em um único cluster.
Tipos de Ligação
A proximidade entre dois clusters é definida pelo tipo de ligação. Métodos de ligação comuns utilizados no agrupamento hierárquico incluem:
-
Ligação simples: distância entre os dois pontos mais próximos nos dois clusters;
-
Ligação completa: distância entre os dois pontos mais distantes nos dois clusters;
-
Ligação média: distância média entre todos os pares de pontos nos dois clusters;
-
Método de Ward: minimiza o aumento da variância total dentro do cluster ao unir dois clusters.
A escolha do método de ligação pode impactar a forma e a estrutura dos clusters resultantes. Experimentação e conhecimento do domínio frequentemente auxiliam na seleção do melhor método para seus dados.
Dendrograma
Os resultados da clusterização hierárquica são frequentemente visualizados utilizando um dendrograma.
Obrigado pelo seu feedback!