Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Implementação em Conjunto de Dados Real | Seção
Practice
Projects
Quizzes & Challenges
Questionários
Challenges
/
Fundamentos do Aprendizado Não Supervisionado

bookImplementação em Conjunto de Dados Real

Você utilizará o conjunto de dados mall customers, que contém as seguintes colunas:

Você também deve seguir estas etapas antes da clusterização:

  1. Carregar os dados: utilize pandas para carregar o arquivo CSV;
  2. Selecionar atributos relevantes: foque nas colunas 'Annual Income (k$)' e 'Spending Score (1-100)';
  3. Escalonamento dos dados (importante para DBSCAN): como o DBSCAN utiliza cálculos de distância, é fundamental escalonar os atributos para que tenham faixas semelhantes. Utilize StandardScaler para esse propósito.

Interpretação

O código cria 5 clusters neste caso. É importante analisar os clusters resultantes para obter insights sobre a segmentação de clientes. Por exemplo, é possível identificar clusters que representam:

  • Clientes de alta renda e alto gasto;
  • Clientes de alta renda e baixo gasto;
  • Clientes de baixa renda e alto gasto;
  • Clientes de baixa renda e baixo gasto;
  • Clientes de renda e gasto intermediários.

Considerações Finais

question mark

Qual afirmação melhor descreve uma vantagem fundamental do uso do DBSCAN para agrupar o conjunto de dados de clientes de shopping?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 23

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

bookImplementação em Conjunto de Dados Real

Deslize para mostrar o menu

Você utilizará o conjunto de dados mall customers, que contém as seguintes colunas:

Você também deve seguir estas etapas antes da clusterização:

  1. Carregar os dados: utilize pandas para carregar o arquivo CSV;
  2. Selecionar atributos relevantes: foque nas colunas 'Annual Income (k$)' e 'Spending Score (1-100)';
  3. Escalonamento dos dados (importante para DBSCAN): como o DBSCAN utiliza cálculos de distância, é fundamental escalonar os atributos para que tenham faixas semelhantes. Utilize StandardScaler para esse propósito.

Interpretação

O código cria 5 clusters neste caso. É importante analisar os clusters resultantes para obter insights sobre a segmentação de clientes. Por exemplo, é possível identificar clusters que representam:

  • Clientes de alta renda e alto gasto;
  • Clientes de alta renda e baixo gasto;
  • Clientes de baixa renda e alto gasto;
  • Clientes de baixa renda e baixo gasto;
  • Clientes de renda e gasto intermediários.

Considerações Finais

question mark

Qual afirmação melhor descreve uma vantagem fundamental do uso do DBSCAN para agrupar o conjunto de dados de clientes de shopping?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 23
some-alt