Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Implementação em Conjunto de Dados Fictício | Seção
Practice
Projects
Quizzes & Challenges
Questionários
Challenges
/
Fundamentos do Aprendizado Não Supervisionado

bookImplementação em Conjunto de Dados Fictício

Como de costume, você utilizará as seguintes bibliotecas:

  • sklearn para gerar dados fictícios e implementar a clusterização hierárquica (AgglomerativeClustering);

  • scipy para gerar e trabalhar com o dendrograma;

  • matplotlib para visualizar os clusters e o dendrograma;

  • numpy para operações numéricas.

Gerando Dados Fictícios

Você pode utilizar a função make_blobs() do scikit-learn para gerar conjuntos de dados com diferentes números de clusters e graus variados de separação. Isso ajudará a visualizar como a clusterização hierárquica se comporta em diferentes cenários.

O algoritmo geral é o seguinte:

  1. Instanciar o objeto AgglomerativeClustering, especificando o método de ligação e outros parâmetros;

  2. Ajustar o modelo aos dados;

  3. Extrair rótulos dos clusters caso seja definido um número específico de clusters;

  4. Visualizar os clusters (se os dados forem 2D ou 3D) utilizando gráficos de dispersão;

  5. Utilizar o linkage do SciPy para criar a matriz de ligação e, em seguida, o dendrogram para visualizar o dendrograma.

Também é possível experimentar diferentes métodos de ligação (por exemplo, single, complete, average, Ward) e observar como eles afetam os resultados da clusterização e a estrutura do dendrograma.

question mark

Qual classe do scikit-learn é utilizada para realizar agrupamento hierárquico em um conjunto de dados fictício?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 16

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

bookImplementação em Conjunto de Dados Fictício

Deslize para mostrar o menu

Como de costume, você utilizará as seguintes bibliotecas:

  • sklearn para gerar dados fictícios e implementar a clusterização hierárquica (AgglomerativeClustering);

  • scipy para gerar e trabalhar com o dendrograma;

  • matplotlib para visualizar os clusters e o dendrograma;

  • numpy para operações numéricas.

Gerando Dados Fictícios

Você pode utilizar a função make_blobs() do scikit-learn para gerar conjuntos de dados com diferentes números de clusters e graus variados de separação. Isso ajudará a visualizar como a clusterização hierárquica se comporta em diferentes cenários.

O algoritmo geral é o seguinte:

  1. Instanciar o objeto AgglomerativeClustering, especificando o método de ligação e outros parâmetros;

  2. Ajustar o modelo aos dados;

  3. Extrair rótulos dos clusters caso seja definido um número específico de clusters;

  4. Visualizar os clusters (se os dados forem 2D ou 3D) utilizando gráficos de dispersão;

  5. Utilizar o linkage do SciPy para criar a matriz de ligação e, em seguida, o dendrogram para visualizar o dendrograma.

Também é possível experimentar diferentes métodos de ligação (por exemplo, single, complete, average, Ward) e observar como eles afetam os resultados da clusterização e a estrutura do dendrograma.

question mark

Qual classe do scikit-learn é utilizada para realizar agrupamento hierárquico em um conjunto de dados fictício?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 16
some-alt