Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Como o Algoritmo K-Means Funciona? | K-Means
Análise de Clusters

bookComo o Algoritmo K-Means Funciona?

Inicialização

O algoritmo começa selecionando aleatoriamente K centros iniciais de cluster, também conhecidos como centroides. Esses centroides servem como pontos de partida para cada cluster. Uma abordagem comum é escolher aleatoriamente K pontos de dados do conjunto para serem os centroides iniciais.

Etapa de Atribuição

Nesta etapa, cada ponto de dado é atribuído ao centroide mais próximo. A distância é normalmente medida usando a distância Euclidiana, mas outros métodos de distância também podem ser utilizados. Cada ponto de dado é colocado no cluster representado pelo centroide mais próximo.

Etapa de Atualização

Após todos os pontos de dados serem atribuídos aos clusters, os centroides são recalculados. Para cada cluster, o novo centroide é calculado como a média de todos os pontos de dados pertencentes àquele cluster. Essencialmente, o centroide é movido para o centro do seu cluster.

Iteração

As etapas 2 e 3 são repetidas de forma iterativa. Em cada iteração, os pontos de dados são reatribuídos aos clusters com base nos centroides atualizados, e então os centroides são recalculados com base nas novas atribuições de cluster. Esse processo iterativo continua até que um critério de parada seja atingido.

Convergência

O algoritmo para quando uma das seguintes condições é atendida:

  • Os centroides não mudam significativamente: as posições dos centroides se estabilizam, ou seja, nas iterações seguintes, há pouca alteração em suas localizações;

  • As atribuições dos pontos de dados não mudam: os pontos de dados permanecem nos mesmos clusters, indicando que a estrutura dos clusters se tornou estável;

  • O número máximo de iterações é atingido: um número máximo de iterações pré-definido é alcançado. Isso impede que o algoritmo rode indefinidamente.

Ao convergir, o algoritmo K-means particiona os dados em K clusters, com cada cluster representado por seu centroide. Os clusters resultantes buscam ser coerentes internamente e separados externamente com base na métrica de distância escolhida e no processo iterativo de refinamento.

question mark

Durante a etapa de atualização no algoritmo K-means, qual é a principal ação realizada?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 2

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 2.94

bookComo o Algoritmo K-Means Funciona?

Deslize para mostrar o menu

Inicialização

O algoritmo começa selecionando aleatoriamente K centros iniciais de cluster, também conhecidos como centroides. Esses centroides servem como pontos de partida para cada cluster. Uma abordagem comum é escolher aleatoriamente K pontos de dados do conjunto para serem os centroides iniciais.

Etapa de Atribuição

Nesta etapa, cada ponto de dado é atribuído ao centroide mais próximo. A distância é normalmente medida usando a distância Euclidiana, mas outros métodos de distância também podem ser utilizados. Cada ponto de dado é colocado no cluster representado pelo centroide mais próximo.

Etapa de Atualização

Após todos os pontos de dados serem atribuídos aos clusters, os centroides são recalculados. Para cada cluster, o novo centroide é calculado como a média de todos os pontos de dados pertencentes àquele cluster. Essencialmente, o centroide é movido para o centro do seu cluster.

Iteração

As etapas 2 e 3 são repetidas de forma iterativa. Em cada iteração, os pontos de dados são reatribuídos aos clusters com base nos centroides atualizados, e então os centroides são recalculados com base nas novas atribuições de cluster. Esse processo iterativo continua até que um critério de parada seja atingido.

Convergência

O algoritmo para quando uma das seguintes condições é atendida:

  • Os centroides não mudam significativamente: as posições dos centroides se estabilizam, ou seja, nas iterações seguintes, há pouca alteração em suas localizações;

  • As atribuições dos pontos de dados não mudam: os pontos de dados permanecem nos mesmos clusters, indicando que a estrutura dos clusters se tornou estável;

  • O número máximo de iterações é atingido: um número máximo de iterações pré-definido é alcançado. Isso impede que o algoritmo rode indefinidamente.

Ao convergir, o algoritmo K-means particiona os dados em K clusters, com cada cluster representado por seu centroide. Os clusters resultantes buscam ser coerentes internamente e separados externamente com base na métrica de distância escolhida e no processo iterativo de refinamento.

question mark

Durante a etapa de atualização no algoritmo K-means, qual é a principal ação realizada?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 2
some-alt