Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Analisando Dados com Box Plots | Seção
Visualização de Dados com Matplotlib
Seção 1. Capítulo 16
single

single

bookAnalisando Dados com Box Plots

Deslize para mostrar o menu

Note
Definição

Box plot é outro gráfico extremamente comum em estatística, utilizado para visualizar a tendência central, dispersão e possíveis outliers nos dados por meio de seus quartis.

Quartis

quartis

Quartis dividem os dados ordenados em quatro partes iguais:

  • Q1 — ponto médio entre o valor mínimo e a mediana (25% dos dados abaixo deste ponto);
  • Q2 — a mediana (50% dos dados abaixo);
  • Q3 — ponto médio entre a mediana e o valor máximo (75% dos dados abaixo).

Elementos do Box Plot

box_plot_explained
  • O lado esquerdo da caixa representa Q1, o lado direito representa Q3;
  • IQR = Q3 − Q1, mostrado como a largura da caixa, com a mediana marcada por uma linha amarela;
  • Bigodes se estendem até (Q1 - 1,5 \cdot IQR) e (Q3 + 1,5 \cdot IQR);
  • Pontos fora dos bigodes são outliers.

Um box plot pode ser gerado usando matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Dados do Box Plot

Utilize plt.boxplot(x), onde x pode ser um objeto array-like 1D, um array 2D (uma caixa por coluna) ou uma sequência de arrays 1D.

Parâmetros Opcionais

tick_labels é útil para nomear box plots — especialmente ao plotar múltiplos arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Ao passar um DataFrame com duas colunas numéricas para boxplot(), são criados dois box plots separados com rótulos atribuídos automaticamente.

Note
Aprofunde-se

Há também diversos parâmetros opcionais para personalizar o box plot, que podem ser explorados na documentação do boxplot(), porém, na prática, raramente são utilizados.

Tarefa

Deslize para começar a programar

Crie dois box plots usando duas amostras da distribuição normal padrão:

  1. Utilize a função correta para criar os box plots.
  2. Use a lista de normal_sample_1 e normal_sample_2 (nesta ordem, da esquerda para a direita) como os dados.
  3. Rotule o box plot da esquerda como First sample e o da direita como Second sample utilizando a list.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 16
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

some-alt