Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Аналіз Даних за Допомогою Box Plot | Розділ
Practice
Projects
Quizzes & Challenges
Вікторини
Challenges
/
Візуалізація Даних з Matplotlib

bookАналіз Даних за Допомогою Box Plot

Note
Визначення

Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних за допомогою квартилів.

Квартилі

quartiles

Квартилі поділяють відсортовані дані на чотири рівні частини:

  • Q1 — середнє значення між мінімумом і медіаною (25% даних нижче цього значення);
  • Q2 — медіана (50% даних нижче);
  • Q3 — середнє значення між медіаною і максимумом (75% даних нижче).

Елементи box plot

box_plot_explained
  • Ліва сторона коробки показує Q1, права сторона — Q3;
  • IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
  • Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
  • Точки за межами вусів — це викиди.

Коробчасту діаграму можна побудувати за допомогою matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Дані коробчастої діаграми

Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.

Додаткові параметри

tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремі box plot-и з автоматично призначеними підписами.

Note
Додаткове вивчення

Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися в документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.

Завдання

Swipe to start coding

Створення двох box plot за допомогою двох вибірок зі стандартного нормального розподілу:

  1. Використання відповідної функції для побудови box plot.
  2. Використання списку normal_sample_1 та normal_sample_2 (у такому порядку зліва направо) як дані.
  3. Позначення лівого box plot як First sample, а правого — як Second sample за допомогою list.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 16
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

bookАналіз Даних за Допомогою Box Plot

Свайпніть щоб показати меню

Note
Визначення

Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних за допомогою квартилів.

Квартилі

quartiles

Квартилі поділяють відсортовані дані на чотири рівні частини:

  • Q1 — середнє значення між мінімумом і медіаною (25% даних нижче цього значення);
  • Q2 — медіана (50% даних нижче);
  • Q3 — середнє значення між медіаною і максимумом (75% даних нижче).

Елементи box plot

box_plot_explained
  • Ліва сторона коробки показує Q1, права сторона — Q3;
  • IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
  • Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
  • Точки за межами вусів — це викиди.

Коробчасту діаграму можна побудувати за допомогою matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Дані коробчастої діаграми

Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.

Додаткові параметри

tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремі box plot-и з автоматично призначеними підписами.

Note
Додаткове вивчення

Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися в документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.

Завдання

Swipe to start coding

Створення двох box plot за допомогою двох вибірок зі стандартного нормального розподілу:

  1. Використання відповідної функції для побудови box plot.
  2. Використання списку normal_sample_1 та normal_sample_2 (у такому порядку зліва направо) як дані.
  3. Позначення лівого box plot як First sample, а правого — як Second sample за допомогою list.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 16
single

single

some-alt