Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Estimativa de Densidade com KDE | Seção
Visualização Estatística com Seaborn

bookEstimativa de Densidade com KDE

Um kdeplot (estimativa de densidade por kernel) é um método para visualizar a distribuição de observações em um conjunto de dados. Ele é análogo a um histograma, mas, em vez de usar intervalos discretos, o KDE representa os dados utilizando uma curva contínua de densidade de probabilidade.

Isso o torna excelente para observar o "formato" dos dados e identificar picos sem a irregularidade de um histograma.

Visualização de Distribuições Sobrepostas

Quando há múltiplas categorias (usando hue), linhas simples podem se tornar difíceis de distinguir. O Seaborn oferece parâmetros para resolver isso:

  • Empilhamento (multiple='stack'): em vez de traçar linhas sobrepostas, empilha-as. Mostra como diferentes categorias contribuem para a distribuição total;
  • Preenchimento (fill=True): preenche a área sob a curva com cor, tornando o peso visual de cada categoria mais evidente.

Exemplo:

12345678910111213141516
import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
copy
Tarefa

Swipe to start coding

Visualização da distribuição das temperaturas máximas ao longo do ano:

  1. Importação de pandas, seaborn e matplotlib.pyplot.
  2. Leitura do conjunto de dados meteorológicos.
  3. Definição do estilo para 'ticks' com cor de fundo 'lightcyan' (já fornecido).
  4. Criação de um gráfico KDE com os seguintes parâmetros:
  • Definir x como 'max_temp';
  • Agrupar por 'month' utilizando hue;
  • Empilhar as distribuições utilizando multiple='stack';
  • Preencher as curvas utilizando fill=True;
  • Desabilitar a legenda (legend=False) para evitar poluição visual no gráfico.
  1. Exibição do gráfico.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

bookEstimativa de Densidade com KDE

Deslize para mostrar o menu

Um kdeplot (estimativa de densidade por kernel) é um método para visualizar a distribuição de observações em um conjunto de dados. Ele é análogo a um histograma, mas, em vez de usar intervalos discretos, o KDE representa os dados utilizando uma curva contínua de densidade de probabilidade.

Isso o torna excelente para observar o "formato" dos dados e identificar picos sem a irregularidade de um histograma.

Visualização de Distribuições Sobrepostas

Quando há múltiplas categorias (usando hue), linhas simples podem se tornar difíceis de distinguir. O Seaborn oferece parâmetros para resolver isso:

  • Empilhamento (multiple='stack'): em vez de traçar linhas sobrepostas, empilha-as. Mostra como diferentes categorias contribuem para a distribuição total;
  • Preenchimento (fill=True): preenche a área sob a curva com cor, tornando o peso visual de cada categoria mais evidente.

Exemplo:

12345678910111213141516
import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
copy
Tarefa

Swipe to start coding

Visualização da distribuição das temperaturas máximas ao longo do ano:

  1. Importação de pandas, seaborn e matplotlib.pyplot.
  2. Leitura do conjunto de dados meteorológicos.
  3. Definição do estilo para 'ticks' com cor de fundo 'lightcyan' (já fornecido).
  4. Criação de um gráfico KDE com os seguintes parâmetros:
  • Definir x como 'max_temp';
  • Agrupar por 'month' utilizando hue;
  • Empilhar as distribuições utilizando multiple='stack';
  • Preencher as curvas utilizando fill=True;
  • Desabilitar a legenda (legend=False) para evitar poluição visual no gráfico.
  1. Exibição do gráfico.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5
single

single

some-alt