Realizando Agrupamento Hierárquico
Um clustermap é um gráfico de matriz que combina um heatmap com agrupamento hierárquico.
Enquanto um heatmap padrão exibe os dados em uma grade fixa, um clustermap reordena as linhas e colunas para posicionar valores semelhantes próximos uns dos outros. Os diagramas em forma de árvore nos eixos são chamados de dendrogramas e mostram como os pontos de dados são agrupados.
Parâmetros Principais
Para controlar como o agrupamento funciona, utilize estes parâmetros:
standard_scale: padroniza os dados (0 para linhas, 1 para colunas) para que cada característica tenha média 0 e variância 1. Isso é fundamental quando as variáveis possuem diferentes unidades;metric: a medida de distância a ser utilizada (por exemplo,'euclidean','correlation'). Determina o que significa "semelhante";method: o algoritmo de ligação a ser utilizado (por exemplo,'single','complete','average'). Determina como os agrupamentos são formados.
Exemplo
Aqui está um clustermap do conjunto de dados Iris. Observe como as espécies (linhas) são agrupadas automaticamente porque apresentam medidas semelhantes.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
Swipe to start coding
Analise os dados de passageiros de voos para identificar similaridades entre os anos.
- Defina o estilo como
'ticks'. Altere a cor de fundo para'seagreen'('figure.facecolor'). - Crie um clustermap utilizando o DataFrame
upd_dfremodelado:
- Utilize
upd_dfcomo os dados. - Normalize as colunas configurando
standard_scalepara1. - Utilize o método de clusterização
'single'configurado comomethod. - Utilize
'correlation'configurado comometric. - Defina
annot=True. - Defina
vmin=0evmax=10. - Utilize o mapa de cores
'vlag'.
- Exiba o gráfico.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Incrível!
Completion taxa melhorada para 4.55
Realizando Agrupamento Hierárquico
Deslize para mostrar o menu
Um clustermap é um gráfico de matriz que combina um heatmap com agrupamento hierárquico.
Enquanto um heatmap padrão exibe os dados em uma grade fixa, um clustermap reordena as linhas e colunas para posicionar valores semelhantes próximos uns dos outros. Os diagramas em forma de árvore nos eixos são chamados de dendrogramas e mostram como os pontos de dados são agrupados.
Parâmetros Principais
Para controlar como o agrupamento funciona, utilize estes parâmetros:
standard_scale: padroniza os dados (0 para linhas, 1 para colunas) para que cada característica tenha média 0 e variância 1. Isso é fundamental quando as variáveis possuem diferentes unidades;metric: a medida de distância a ser utilizada (por exemplo,'euclidean','correlation'). Determina o que significa "semelhante";method: o algoritmo de ligação a ser utilizado (por exemplo,'single','complete','average'). Determina como os agrupamentos são formados.
Exemplo
Aqui está um clustermap do conjunto de dados Iris. Observe como as espécies (linhas) são agrupadas automaticamente porque apresentam medidas semelhantes.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('iris') # Prepare matrix (drop non-numeric column for calculation) species = df.pop("species") # Create a clustermap sns.clustermap( data=df, standard_scale=1, # Normalize columns metric='euclidean', # Measure distance method='average', # clustering method cmap='viridis', figsize=(6, 6) ) plt.show()
Swipe to start coding
Analise os dados de passageiros de voos para identificar similaridades entre os anos.
- Defina o estilo como
'ticks'. Altere a cor de fundo para'seagreen'('figure.facecolor'). - Crie um clustermap utilizando o DataFrame
upd_dfremodelado:
- Utilize
upd_dfcomo os dados. - Normalize as colunas configurando
standard_scalepara1. - Utilize o método de clusterização
'single'configurado comomethod. - Utilize
'correlation'configurado comometric. - Defina
annot=True. - Defina
vmin=0evmax=10. - Utilize o mapa de cores
'vlag'.
- Exiba o gráfico.
Solução
Obrigado pelo seu feedback!
single