single
Аналіз Даних за Допомогою Box Plot
Свайпніть щоб показати меню
Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних за допомогою квартилів.
Квартилі
Квартилі поділяють відсортовані дані на чотири рівні частини:
- Q1 — середнє значення між мінімумом і медіаною (25% даних нижче цього значення);
- Q2 — медіана (50% даних нижче);
- Q3 — середнє значення між медіаною і максимумом (75% даних нижче).
Елементи box plot
- Ліва сторона коробки показує Q1, права сторона — Q3;
- IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
- Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
- Точки за межами вусів — це викиди.
Коробчасту діаграму можна побудувати за допомогою matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Дані коробчастої діаграми
Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.
Додаткові параметри
tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремі box plot-и з автоматично призначеними підписами.
Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися в документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.
Swipe to start coding
Створення двох box plot за допомогою двох вибірок зі стандартного нормального розподілу:
- Використання відповідної функції для побудови box plot.
- Використання списку
normal_sample_1таnormal_sample_2(у такому порядку зліва направо) як дані. - Позначення лівого box plot як
First sample, а правого — якSecond sampleза допомогоюlist.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат