Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Realizando Agrupamento Hierárquico | Seção
Practice
Projects
Quizzes & Challenges
Questionários
Challenges
/
Visualização Estatística com Seaborn

bookRealizando Agrupamento Hierárquico

Um clustermap é um gráfico de matriz que combina um heatmap com agrupamento hierárquico.

Enquanto um heatmap padrão exibe os dados em uma grade fixa, um clustermap reordena as linhas e colunas para posicionar valores semelhantes próximos uns dos outros. Os diagramas em forma de árvore nos eixos são chamados de dendrogramas e mostram como os pontos de dados são agrupados.

Parâmetros Principais

Para controlar como o agrupamento funciona, utilize estes parâmetros:

  • standard_scale: padroniza os dados (0 para linhas, 1 para colunas) para que cada característica tenha média 0 e variância 1. Isso é fundamental quando as variáveis possuem diferentes unidades;
  • metric: a medida de distância a ser utilizada (por exemplo, 'euclidean', 'correlation'). Determina o que significa "semelhante";
  • method: o algoritmo de ligação a ser utilizado (por exemplo, 'single', 'complete', 'average'). Determina como os agrupamentos são formados.

Exemplo

Aqui está um clustermap do conjunto de dados Iris. Observe como as espécies (linhas) são agrupadas automaticamente porque apresentam medidas semelhantes.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
copy
Tarefa

Swipe to start coding

Analise os dados de passageiros de voos para identificar similaridades entre os anos.

  1. Defina o estilo como 'ticks'. Altere a cor de fundo para 'seagreen' ('figure.facecolor').
  2. Crie um clustermap utilizando o DataFrame upd_df remodelado:
  • Utilize upd_df como os dados.
  • Normalize as colunas configurando standard_scale para 1.
  • Utilize o método de clusterização 'single' configurado como method.
  • Utilize 'correlation' configurado como metric.
  • Defina annot=True.
  • Defina vmin=0 e vmax=10.
  • Utilize o mapa de cores 'vlag'.
  1. Exiba o gráfico.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 17
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

bookRealizando Agrupamento Hierárquico

Deslize para mostrar o menu

Um clustermap é um gráfico de matriz que combina um heatmap com agrupamento hierárquico.

Enquanto um heatmap padrão exibe os dados em uma grade fixa, um clustermap reordena as linhas e colunas para posicionar valores semelhantes próximos uns dos outros. Os diagramas em forma de árvore nos eixos são chamados de dendrogramas e mostram como os pontos de dados são agrupados.

Parâmetros Principais

Para controlar como o agrupamento funciona, utilize estes parâmetros:

  • standard_scale: padroniza os dados (0 para linhas, 1 para colunas) para que cada característica tenha média 0 e variância 1. Isso é fundamental quando as variáveis possuem diferentes unidades;
  • metric: a medida de distância a ser utilizada (por exemplo, 'euclidean', 'correlation'). Determina o que significa "semelhante";
  • method: o algoritmo de ligação a ser utilizado (por exemplo, 'single', 'complete', 'average'). Determina como os agrupamentos são formados.

Exemplo

Aqui está um clustermap do conjunto de dados Iris. Observe como as espécies (linhas) são agrupadas automaticamente porque apresentam medidas semelhantes.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
copy
Tarefa

Swipe to start coding

Analise os dados de passageiros de voos para identificar similaridades entre os anos.

  1. Defina o estilo como 'ticks'. Altere a cor de fundo para 'seagreen' ('figure.facecolor').
  2. Crie um clustermap utilizando o DataFrame upd_df remodelado:
  • Utilize upd_df como os dados.
  • Normalize as colunas configurando standard_scale para 1.
  • Utilize o método de clusterização 'single' configurado como method.
  • Utilize 'correlation' configurado como metric.
  • Defina annot=True.
  • Defina vmin=0 e vmax=10.
  • Utilize o mapa de cores 'vlag'.
  1. Exiba o gráfico.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 17
single

single

some-alt