Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Resumindo Dados com Box Plots | Seção
Practice
Projects
Quizzes & Challenges
Questionários
Challenges
/
Visualização Estatística com Seaborn

bookResumindo Dados com Box Plots

Um boxplot é uma forma padronizada de exibir a distribuição dos dados com base em um resumo de cinco números:

  1. Mínimo (menor valor, excluindo outliers);
  2. Primeiro quartil (Q1) (25º percentil);
  3. Mediana (50º percentil);
  4. Terceiro quartil (Q3) (75º percentil);
  5. Máximo (maior valor, excluindo outliers).

Por que usar um Boxplot?

É a melhor ferramenta para comparar distribuições entre grupos. Ele mostra imediatamente:

  • Tendência central: onde está a linha da mediana?;
  • Dispersão: qual a altura da caixa? (o intervalo interquartil);
  • Simetria: a mediana está no centro da caixa?;
  • Outliers: existem pontos fora dos limites dos bigodes?

Parâmetros principais

  • saturation: controla a intensidade das cores (0 a 1). Valores menores deixam as cores mais suaves;
  • linewidth: controla a espessura dos contornos da caixa e dos bigodes;
  • width: controla a largura da própria caixa.

Exemplo

Aqui está um boxplot analisando o conjunto de dados "Tips". Observe como os pontos que representam outliers aparecem acima dos bigodes.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tarefa

Swipe to start coding

Visualização da distância dos planetas descobertos por diferentes métodos.

  1. Definir o estilo como 'ticks'. Personalizar o tema passando um dicionário para alterar o fundo para 'grey' ('figure.facecolor') e as cores dos ticks para 'white' ('xtick.color' e 'ytick.color').
  2. Criar um boxplot utilizando o conjunto de dados planets (df):
  • Mapear 'distance' para o eixo x e 'method' para o eixo y.
  • Definir a width da caixa como 0.6.
  • Tornar as linhas mais espessas usando linewidth=2.
  • Atenuar significativamente as cores ajustando saturation para 0.4.
  • Utilizar a paleta 'vlag'.
  1. Exibir o gráfico.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 11
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

bookResumindo Dados com Box Plots

Deslize para mostrar o menu

Um boxplot é uma forma padronizada de exibir a distribuição dos dados com base em um resumo de cinco números:

  1. Mínimo (menor valor, excluindo outliers);
  2. Primeiro quartil (Q1) (25º percentil);
  3. Mediana (50º percentil);
  4. Terceiro quartil (Q3) (75º percentil);
  5. Máximo (maior valor, excluindo outliers).

Por que usar um Boxplot?

É a melhor ferramenta para comparar distribuições entre grupos. Ele mostra imediatamente:

  • Tendência central: onde está a linha da mediana?;
  • Dispersão: qual a altura da caixa? (o intervalo interquartil);
  • Simetria: a mediana está no centro da caixa?;
  • Outliers: existem pontos fora dos limites dos bigodes?

Parâmetros principais

  • saturation: controla a intensidade das cores (0 a 1). Valores menores deixam as cores mais suaves;
  • linewidth: controla a espessura dos contornos da caixa e dos bigodes;
  • width: controla a largura da própria caixa.

Exemplo

Aqui está um boxplot analisando o conjunto de dados "Tips". Observe como os pontos que representam outliers aparecem acima dos bigodes.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tarefa

Swipe to start coding

Visualização da distância dos planetas descobertos por diferentes métodos.

  1. Definir o estilo como 'ticks'. Personalizar o tema passando um dicionário para alterar o fundo para 'grey' ('figure.facecolor') e as cores dos ticks para 'white' ('xtick.color' e 'ytick.color').
  2. Criar um boxplot utilizando o conjunto de dados planets (df):
  • Mapear 'distance' para o eixo x e 'method' para o eixo y.
  • Definir a width da caixa como 0.6.
  • Tornar as linhas mais espessas usando linewidth=2.
  • Atenuar significativamente as cores ajustando saturation para 0.4.
  • Utilizar a paleta 'vlag'.
  1. Exibir o gráfico.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 11
single

single

some-alt