Ящик з вусами
Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних через їх квартилі.
Квартилі
Квартилі ділять відсортовані дані на чотири рівні частини:
- Q1 — середина між мінімальним значенням і медіаною (25% даних нижче цього значення);
- Q2 — медіана (50% даних нижче);
- Q3 — середина між медіаною і максимальним значенням (75% даних нижче).
Елементи box plot
- Ліва сторона коробки показує Q1, права сторона показує Q3;
- IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
- Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
- Точки за межами вусів — це викиди.
Коробчасту діаграму можна побудувати за допомогою matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Дані для коробчастої діаграми
Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.
Додаткові параметри
tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремих box plot-и з автоматично призначеними підписами.
Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися у документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.
Swipe to start coding
Створення двох box plot-графіків, використовуючи дві вибірки зі стандартного нормального розподілу:
- Використайте відповідну функцію для побудови box plot-графіків.
- В якості даних використайте список
normal_sample_1таnormal_sample_2(у такому порядку зліва направо). - Позначте лівий box plot як
First sample, а правий — якSecond sample, використовуючиlist.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain how to interpret a box plot?
What does the IQR tell us about the data?
How do I identify outliers using a box plot?
Awesome!
Completion rate improved to 3.85
Ящик з вусами
Свайпніть щоб показати меню
Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних через їх квартилі.
Квартилі
Квартилі ділять відсортовані дані на чотири рівні частини:
- Q1 — середина між мінімальним значенням і медіаною (25% даних нижче цього значення);
- Q2 — медіана (50% даних нижче);
- Q3 — середина між медіаною і максимальним значенням (75% даних нижче).
Елементи box plot
- Ліва сторона коробки показує Q1, права сторона показує Q3;
- IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
- Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
- Точки за межами вусів — це викиди.
Коробчасту діаграму можна побудувати за допомогою matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Дані для коробчастої діаграми
Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.
Додаткові параметри
tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремих box plot-и з автоматично призначеними підписами.
Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися у документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.
Swipe to start coding
Створення двох box plot-графіків, використовуючи дві вибірки зі стандартного нормального розподілу:
- Використайте відповідну функцію для побудови box plot-графіків.
- В якості даних використайте список
normal_sample_1таnormal_sample_2(у такому порядку зліва направо). - Позначте лівий box plot як
First sample, а правий — якSecond sample, використовуючиlist.
Рішення
Дякуємо за ваш відгук!
single