Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Boxplot | Mais Gráficos Estatísticos
Visualização Definitiva com Python

bookBoxplot

Note
Definição

Box plot é outro gráfico extremamente comum em estatística, utilizado para visualizar a tendência central, dispersão e possíveis outliers nos dados por meio de seus quartis.

Quartis

quartis

Quartis dividem os dados ordenados em quatro partes iguais:

  • Q1 — ponto médio entre o valor mínimo e a mediana (25% dos dados abaixo dele);
  • Q2 — a mediana (50% dos dados abaixo);
  • Q3 — ponto médio entre a mediana e o valor máximo (75% dos dados abaixo).

Elementos do Box Plot

box_plot_explained
  • O lado esquerdo da caixa representa o Q1, o lado direito representa o Q3;
  • IQR = Q3 − Q1, mostrado como a largura da caixa, com a mediana marcada por uma linha amarela;
  • Bigodes se estendem até (Q1 - 1,5 \cdot IQR) e (Q3 + 1,5 \cdot IQR);
  • Pontos fora dos bigodes são outliers.

Um box plot pode ser gerado usando matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Dados do Box Plot

Utilize plt.boxplot(x), onde x pode ser um objeto array-like 1D, um array 2D (uma caixa por coluna) ou uma sequência de arrays 1D.

Parâmetros Opcionais

tick_labels é útil para nomear box plots — especialmente ao plotar múltiplos arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Ao passar um DataFrame com duas colunas numéricas para boxplot(), são criados dois box plots separados com rótulos atribuídos automaticamente.

Note
Estude Mais

Há também diversos parâmetros opcionais para personalizar o box plot, que podem ser explorados na documentação do boxplot(), porém, na prática, você pode raramente utilizá-los.

Tarefa

Swipe to start coding

Crie dois box plots usando duas amostras da distribuição normal padrão:

  1. Utilize a função correta para criar os box plots.
  2. Use a lista de normal_sample_1 e normal_sample_2 (nesta ordem, da esquerda para a direita) como os dados.
  3. Rotule o box plot da esquerda como First sample e o da direita como Second sample utilizando a list.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 2
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain how to interpret a box plot?

What does the IQR tell us about the data?

How do I identify outliers using a box plot?

close

bookBoxplot

Deslize para mostrar o menu

Note
Definição

Box plot é outro gráfico extremamente comum em estatística, utilizado para visualizar a tendência central, dispersão e possíveis outliers nos dados por meio de seus quartis.

Quartis

quartis

Quartis dividem os dados ordenados em quatro partes iguais:

  • Q1 — ponto médio entre o valor mínimo e a mediana (25% dos dados abaixo dele);
  • Q2 — a mediana (50% dos dados abaixo);
  • Q3 — ponto médio entre a mediana e o valor máximo (75% dos dados abaixo).

Elementos do Box Plot

box_plot_explained
  • O lado esquerdo da caixa representa o Q1, o lado direito representa o Q3;
  • IQR = Q3 − Q1, mostrado como a largura da caixa, com a mediana marcada por uma linha amarela;
  • Bigodes se estendem até (Q1 - 1,5 \cdot IQR) e (Q3 + 1,5 \cdot IQR);
  • Pontos fora dos bigodes são outliers.

Um box plot pode ser gerado usando matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Dados do Box Plot

Utilize plt.boxplot(x), onde x pode ser um objeto array-like 1D, um array 2D (uma caixa por coluna) ou uma sequência de arrays 1D.

Parâmetros Opcionais

tick_labels é útil para nomear box plots — especialmente ao plotar múltiplos arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Ao passar um DataFrame com duas colunas numéricas para boxplot(), são criados dois box plots separados com rótulos atribuídos automaticamente.

Note
Estude Mais

Há também diversos parâmetros opcionais para personalizar o box plot, que podem ser explorados na documentação do boxplot(), porém, na prática, você pode raramente utilizá-los.

Tarefa

Swipe to start coding

Crie dois box plots usando duas amostras da distribuição normal padrão:

  1. Utilize a função correta para criar os box plots.
  2. Use a lista de normal_sample_1 e normal_sample_2 (nesta ordem, da esquerda para a direita) como os dados.
  3. Rotule o box plot da esquerda como First sample e o da direita como Second sample utilizando a list.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 2
single

single

some-alt