Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Ящик з вусами | Додаткові Статистичні Графіки
Універсальна Візуалізація з Python

bookЯщик з вусами

Note
Визначення

Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних через їх квартилі.

Квартилі

квартилі

Квартилі ділять відсортовані дані на чотири рівні частини:

  • Q1 — середина між мінімальним значенням і медіаною (25% даних нижче цього значення);
  • Q2 — медіана (50% даних нижче);
  • Q3 — середина між медіаною і максимальним значенням (75% даних нижче).

Елементи box plot

box_plot_explained
  • Ліва сторона коробки показує Q1, права сторона показує Q3;
  • IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
  • Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
  • Точки за межами вусів — це викиди.

Коробчасту діаграму можна побудувати за допомогою matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Дані для коробчастої діаграми

Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.

Додаткові параметри

tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремих box plot-и з автоматично призначеними підписами.

Note
Додаткове вивчення

Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися у документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.

Завдання

Swipe to start coding

Створення двох box plot-графіків, використовуючи дві вибірки зі стандартного нормального розподілу:

  1. Використайте відповідну функцію для побудови box plot-графіків.
  2. В якості даних використайте список normal_sample_1 та normal_sample_2 (у такому порядку зліва направо).
  3. Позначте лівий box plot як First sample, а правий — як Second sample, використовуючи list.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 2
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain how to interpret a box plot?

What does the IQR tell us about the data?

How do I identify outliers using a box plot?

close

Awesome!

Completion rate improved to 3.85

bookЯщик з вусами

Свайпніть щоб показати меню

Note
Визначення

Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних через їх квартилі.

Квартилі

квартилі

Квартилі ділять відсортовані дані на чотири рівні частини:

  • Q1 — середина між мінімальним значенням і медіаною (25% даних нижче цього значення);
  • Q2 — медіана (50% даних нижче);
  • Q3 — середина між медіаною і максимальним значенням (75% даних нижче).

Елементи box plot

box_plot_explained
  • Ліва сторона коробки показує Q1, права сторона показує Q3;
  • IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
  • Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
  • Точки за межами вусів — це викиди.

Коробчасту діаграму можна побудувати за допомогою matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Дані для коробчастої діаграми

Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.

Додаткові параметри

tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремих box plot-и з автоматично призначеними підписами.

Note
Додаткове вивчення

Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися у документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.

Завдання

Swipe to start coding

Створення двох box plot-графіків, використовуючи дві вибірки зі стандартного нормального розподілу:

  1. Використайте відповідну функцію для побудови box plot-графіків.
  2. В якості даних використайте список normal_sample_1 та normal_sample_2 (у такому порядку зліва направо).
  3. Позначте лівий box plot як First sample, а правий — як Second sample, використовуючи list.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 2
single

single

some-alt