Como Funciona o Algoritmo K-Means?
Inicialização
O algoritmo começa selecionando aleatoriamente K centros iniciais de cluster, também conhecidos como centróides. Esses centróides servem como pontos de partida para cada cluster. Uma abordagem comum é escolher aleatoriamente K pontos de dados do conjunto de dados para serem os centróides iniciais.
Etapa de Atribuição
Nesta etapa, cada ponto de dado é atribuído ao centróide mais próximo. A distância é normalmente medida usando a distância Euclidiana, mas outros métodos de distância também podem ser utilizados. Cada ponto de dado é colocado no cluster representado pelo centróide mais próximo.
Etapa de Atualização
Depois que todos os pontos de dados são atribuídos aos clusters, os centróides são recalculados. Para cada cluster, o novo centróide é calculado como a média de todos os pontos de dados pertencentes àquele cluster. Essencialmente, o centróide é movido para o centro do seu cluster.
Iteração
As etapas 2 e 3 são repetidas de forma iterativa. Em cada iteração, os pontos de dados são reatribuídos aos clusters com base nos centróides atualizados, e então os centróides são recalculados com base nas novas atribuições de cluster. Esse processo iterativo continua até que um critério de parada seja atingido.
Convergência
O algoritmo para quando uma das seguintes condições é atendida:
-
Os centróides não mudam significativamente: as posições dos centróides se estabilizam, ou seja, nas iterações seguintes, há pouca alteração em suas localizações;
-
As atribuições dos pontos de dados não mudam: os pontos de dados permanecem nos mesmos clusters, indicando que a estrutura dos clusters se tornou estável;
-
O número máximo de iterações é atingido: um número máximo de iterações pré-definido é alcançado. Isso impede que o algoritmo rode indefinidamente.
Após a convergência, o algoritmo K-means particiona os dados em K clusters, com cada cluster representado por seu centróide. Os clusters resultantes buscam ser coerentes internamente e separados externamente com base no método de distância escolhido e no processo iterativo de refinamento.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Incrível!
Completion taxa melhorada para 3.23
Como Funciona o Algoritmo K-Means?
Deslize para mostrar o menu
Inicialização
O algoritmo começa selecionando aleatoriamente K centros iniciais de cluster, também conhecidos como centróides. Esses centróides servem como pontos de partida para cada cluster. Uma abordagem comum é escolher aleatoriamente K pontos de dados do conjunto de dados para serem os centróides iniciais.
Etapa de Atribuição
Nesta etapa, cada ponto de dado é atribuído ao centróide mais próximo. A distância é normalmente medida usando a distância Euclidiana, mas outros métodos de distância também podem ser utilizados. Cada ponto de dado é colocado no cluster representado pelo centróide mais próximo.
Etapa de Atualização
Depois que todos os pontos de dados são atribuídos aos clusters, os centróides são recalculados. Para cada cluster, o novo centróide é calculado como a média de todos os pontos de dados pertencentes àquele cluster. Essencialmente, o centróide é movido para o centro do seu cluster.
Iteração
As etapas 2 e 3 são repetidas de forma iterativa. Em cada iteração, os pontos de dados são reatribuídos aos clusters com base nos centróides atualizados, e então os centróides são recalculados com base nas novas atribuições de cluster. Esse processo iterativo continua até que um critério de parada seja atingido.
Convergência
O algoritmo para quando uma das seguintes condições é atendida:
-
Os centróides não mudam significativamente: as posições dos centróides se estabilizam, ou seja, nas iterações seguintes, há pouca alteração em suas localizações;
-
As atribuições dos pontos de dados não mudam: os pontos de dados permanecem nos mesmos clusters, indicando que a estrutura dos clusters se tornou estável;
-
O número máximo de iterações é atingido: um número máximo de iterações pré-definido é alcançado. Isso impede que o algoritmo rode indefinidamente.
Após a convergência, o algoritmo K-means particiona os dados em K clusters, com cada cluster representado por seu centróide. Os clusters resultantes buscam ser coerentes internamente e separados externamente com base no método de distância escolhido e no processo iterativo de refinamento.
Obrigado pelo seu feedback!