Resumindo Dados com Box Plots
Um boxplot é uma forma padronizada de exibir a distribuição dos dados com base em um resumo de cinco números:
- Mínimo (menor valor, excluindo outliers);
- Primeiro quartil (Q1) (25º percentil);
- Mediana (50º percentil);
- Terceiro quartil (Q3) (75º percentil);
- Máximo (maior valor, excluindo outliers).
Por que usar um Boxplot?
É a melhor ferramenta para comparar distribuições entre grupos. Ele mostra imediatamente:
- Tendência central: onde está a linha da mediana?;
- Dispersão: qual a altura da caixa? (o intervalo interquartil);
- Simetria: a mediana está no centro da caixa?;
- Outliers: existem pontos fora dos limites dos bigodes?
Parâmetros principais
saturation: controla a intensidade das cores (0 a 1). Valores menores deixam as cores mais suaves;linewidth: controla a espessura dos contornos da caixa e dos bigodes;width: controla a largura da própria caixa.
Exemplo
Aqui está um boxplot analisando o conjunto de dados "Tips". Observe como os pontos que representam outliers aparecem acima dos bigodes.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualização da distância dos planetas descobertos por diferentes métodos.
- Definir o estilo como
'ticks'. Personalizar o tema passando um dicionário para alterar o fundo para'grey'('figure.facecolor') e as cores dos ticks para'white'('xtick.color'e'ytick.color'). - Criar um boxplot utilizando o conjunto de dados
planets(df):
- Mapear
'distance'para o eixoxe'method'para o eixoy. - Definir a
widthda caixa como0.6. - Tornar as linhas mais espessas usando
linewidth=2. - Atenuar significativamente as cores ajustando
saturationpara0.4. - Utilizar a paleta
'vlag'.
- Exibir o gráfico.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Incrível!
Completion taxa melhorada para 4.55
Resumindo Dados com Box Plots
Deslize para mostrar o menu
Um boxplot é uma forma padronizada de exibir a distribuição dos dados com base em um resumo de cinco números:
- Mínimo (menor valor, excluindo outliers);
- Primeiro quartil (Q1) (25º percentil);
- Mediana (50º percentil);
- Terceiro quartil (Q3) (75º percentil);
- Máximo (maior valor, excluindo outliers).
Por que usar um Boxplot?
É a melhor ferramenta para comparar distribuições entre grupos. Ele mostra imediatamente:
- Tendência central: onde está a linha da mediana?;
- Dispersão: qual a altura da caixa? (o intervalo interquartil);
- Simetria: a mediana está no centro da caixa?;
- Outliers: existem pontos fora dos limites dos bigodes?
Parâmetros principais
saturation: controla a intensidade das cores (0 a 1). Valores menores deixam as cores mais suaves;linewidth: controla a espessura dos contornos da caixa e dos bigodes;width: controla a largura da própria caixa.
Exemplo
Aqui está um boxplot analisando o conjunto de dados "Tips". Observe como os pontos que representam outliers aparecem acima dos bigodes.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualização da distância dos planetas descobertos por diferentes métodos.
- Definir o estilo como
'ticks'. Personalizar o tema passando um dicionário para alterar o fundo para'grey'('figure.facecolor') e as cores dos ticks para'white'('xtick.color'e'ytick.color'). - Criar um boxplot utilizando o conjunto de dados
planets(df):
- Mapear
'distance'para o eixoxe'method'para o eixoy. - Definir a
widthda caixa como0.6. - Tornar as linhas mais espessas usando
linewidth=2. - Atenuar significativamente as cores ajustando
saturationpara0.4. - Utilizar a paleta
'vlag'.
- Exibir o gráfico.
Solução
Obrigado pelo seu feedback!
single