Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Como Funciona a Clusterização Hierárquica? | Agrupamento Hierárquico
Análise de Clusters

bookComo Funciona a Clusterização Hierárquica?

Note
Definição

Agrupamento hierárquico é um método de análise de agrupamentos que busca construir uma hierarquia de grupos. Diferente do K-means, não exige que o número de grupos seja pré-definido.

O algoritmo pode começar com cada ponto em seu próprio grupo e, sucessivamente, uni-los (agrupamento aglomerativo), ou começar com todos os pontos em um único grupo e dividi-los recursivamente em grupos menores (agrupamento divisivo).

Como o agrupamento aglomerativo é a abordagem mais utilizada, focaremos nele.

O tipo mais comum de agrupamento hierárquico é a abordagem bottom-up. O algoritmo segue os seguintes passos:

  1. Inicialização: cada ponto de dado é tratado como um grupo único;

  2. Calcular matriz de proximidade: calcular a distância entre cada par de grupos;

  3. Unir grupos: os dois grupos mais próximos são unidos em um único grupo;

  4. Atualizar matriz de proximidade: recalcular as distâncias entre o novo grupo e todos os grupos restantes;

  5. Repetir: os passos 3 e 4 são repetidos até que todos os pontos de dados estejam unidos em um único grupo.

Tipos de Ligação

A proximidade entre dois clusters é definida pelo tipo de ligação. Métodos comuns de ligação utilizados na clusterização hierárquica incluem:

  • Ligação simples: a distância entre os dois pontos mais próximos nos dois clusters;

  • Ligação completa: a distância entre os dois pontos mais distantes nos dois clusters;

  • Ligação média: a distância média entre todos os pares de pontos nos dois clusters;

  • Método de Ward: minimiza o aumento da variância total dentro do cluster ao unir dois clusters.

A escolha do método de ligação pode impactar a forma e a estrutura dos clusters resultantes. Experimentação e conhecimento do domínio frequentemente auxiliam na seleção do melhor método para seus dados.

Dendrograma

Os resultados da clusterização hierárquica são frequentemente visualizados utilizando um dendrograma.

Note
Definição

Um dendrograma é um diagrama em forma de árvore que mostra a relação hierárquica entre os clusters. A altura dos ramos no dendrograma representa a distância entre os clusters.

question mark

Qual é a principal característica da abordagem hierárquica de clusterização de baixo para cima (aglomerativa)?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 2.94

bookComo Funciona a Clusterização Hierárquica?

Deslize para mostrar o menu

Note
Definição

Agrupamento hierárquico é um método de análise de agrupamentos que busca construir uma hierarquia de grupos. Diferente do K-means, não exige que o número de grupos seja pré-definido.

O algoritmo pode começar com cada ponto em seu próprio grupo e, sucessivamente, uni-los (agrupamento aglomerativo), ou começar com todos os pontos em um único grupo e dividi-los recursivamente em grupos menores (agrupamento divisivo).

Como o agrupamento aglomerativo é a abordagem mais utilizada, focaremos nele.

O tipo mais comum de agrupamento hierárquico é a abordagem bottom-up. O algoritmo segue os seguintes passos:

  1. Inicialização: cada ponto de dado é tratado como um grupo único;

  2. Calcular matriz de proximidade: calcular a distância entre cada par de grupos;

  3. Unir grupos: os dois grupos mais próximos são unidos em um único grupo;

  4. Atualizar matriz de proximidade: recalcular as distâncias entre o novo grupo e todos os grupos restantes;

  5. Repetir: os passos 3 e 4 são repetidos até que todos os pontos de dados estejam unidos em um único grupo.

Tipos de Ligação

A proximidade entre dois clusters é definida pelo tipo de ligação. Métodos comuns de ligação utilizados na clusterização hierárquica incluem:

  • Ligação simples: a distância entre os dois pontos mais próximos nos dois clusters;

  • Ligação completa: a distância entre os dois pontos mais distantes nos dois clusters;

  • Ligação média: a distância média entre todos os pares de pontos nos dois clusters;

  • Método de Ward: minimiza o aumento da variância total dentro do cluster ao unir dois clusters.

A escolha do método de ligação pode impactar a forma e a estrutura dos clusters resultantes. Experimentação e conhecimento do domínio frequentemente auxiliam na seleção do melhor método para seus dados.

Dendrograma

Os resultados da clusterização hierárquica são frequentemente visualizados utilizando um dendrograma.

Note
Definição

Um dendrograma é um diagrama em forma de árvore que mostra a relação hierárquica entre os clusters. A altura dos ramos no dendrograma representa a distância entre os clusters.

question mark

Qual é a principal característica da abordagem hierárquica de clusterização de baixo para cima (aglomerativa)?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1
some-alt