Deslize para mostrar o menu

Inicialização

O algoritmo começa selecionando aleatoriamente K centros de clusters iniciais, também conhecidos como centroides. Esses centroides servem como pontos de partida para cada cluster. Uma abordagem comum é escolher aleatoriamente K pontos de dados do conjunto para serem os centroides iniciais.

Etapa de Atribuição

Nesta etapa, cada ponto de dado é atribuído ao centroide mais próximo. A distância é normalmente medida usando a distância Euclidiana, mas outros métodos de distância também podem ser utilizados. Cada ponto de dado é colocado no cluster representado pelo centroide mais próximo.

Etapa de Atualização

Depois que todos os pontos de dados são atribuídos aos clusters, os centroides são recalculados. Para cada cluster, o novo centroide é calculado como a média de todos os pontos de dados pertencentes àquele cluster. Essencialmente, o centroide é movido para o centro do seu cluster.

Iteração

As etapas 2 e 3 são repetidas de forma iterativa. Em cada iteração, os pontos de dados são reatribuídos aos clusters com base nos centroides atualizados, e então os centroides são recalculados com base nas novas atribuições de cluster. Esse processo iterativo continua até que um critério de parada seja atingido.

Convergência

O algoritmo para quando uma das seguintes condições é atendida:

Os centroides não mudam significativamente: as posições dos centroides se estabilizam, ou seja, nas iterações seguintes, há pouca alteração em suas localizações;
As atribuições dos pontos de dados não mudam: os pontos de dados permanecem nos mesmos clusters, indicando que a estrutura dos clusters se tornou estável;
O número máximo de iterações é atingido: um número máximo de iterações pré-definido é alcançado. Isso impede que o algoritmo execute indefinidamente.

Após a convergência, o algoritmo K-means particiona os dados em K clusters, com cada cluster representado por seu centroide. Os clusters resultantes buscam ser coerentes internamente e separados externamente com base na métrica de distância escolhida e no processo iterativo de refinamento.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 3. Capítulo 2

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Como o Algoritmo K-Means Funciona?