Аналіз Даних за Допомогою Box Plot
Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних за допомогою квартилів.
Квартилі
Квартилі поділяють відсортовані дані на чотири рівні частини:
- Q1 — середнє значення між мінімумом і медіаною (25% даних нижче цього значення);
- Q2 — медіана (50% даних нижче);
- Q3 — середнє значення між медіаною і максимумом (75% даних нижче).
Елементи box plot
- Ліва сторона коробки показує Q1, права сторона — Q3;
- IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
- Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
- Точки за межами вусів — це викиди.
Коробчасту діаграму можна побудувати за допомогою matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Дані коробчастої діаграми
Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.
Додаткові параметри
tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремі box plot-и з автоматично призначеними підписами.
Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися в документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.
Swipe to start coding
Створення двох box plot за допомогою двох вибірок зі стандартного нормального розподілу:
- Використання відповідної функції для побудови box plot.
- Використання списку
normal_sample_1таnormal_sample_2(у такому порядку зліва направо) як дані. - Позначення лівого box plot як
First sample, а правого — якSecond sampleза допомогоюlist.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Чудово!
Completion показник покращився до 6.25
Аналіз Даних за Допомогою Box Plot
Свайпніть щоб показати меню
Box plot — ще один надзвичайно поширений графік у статистиці, який використовується для візуалізації центральної тенденції, розкиду та потенційних викидів у даних за допомогою квартилів.
Квартилі
Квартилі поділяють відсортовані дані на чотири рівні частини:
- Q1 — середнє значення між мінімумом і медіаною (25% даних нижче цього значення);
- Q2 — медіана (50% даних нижче);
- Q3 — середнє значення між медіаною і максимумом (75% даних нижче).
Елементи box plot
- Ліва сторона коробки показує Q1, права сторона — Q3;
- IQR = Q3 − Q1, відображається як ширина коробки, медіана позначена жовтою лінією;
- Вуса простягаються до (Q1 - 1.5 \cdot IQR) та (Q3 + 1.5 \cdot IQR);
- Точки за межами вусів — це викиди.
Коробчасту діаграму можна побудувати за допомогою matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Дані коробчастої діаграми
Використовуйте plt.boxplot(x), де x може бути одновимірним масивом, двовимірним масивом (одна коробка на стовпець) або послідовністю одновимірних масивів.
Додаткові параметри
tick_labels корисний для іменування box plot-ів — особливо при побудові декількох масивів.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Передача DataFrame з двома числовими стовпцями у boxplot() створює два окремі box plot-и з автоматично призначеними підписами.
Існує також чимало додаткових параметрів для налаштування box plot, з якими ви можете ознайомитися в документації boxplot(), хоча на практиці ви, ймовірно, рідко будете їх використовувати.
Swipe to start coding
Створення двох box plot за допомогою двох вибірок зі стандартного нормального розподілу:
- Використання відповідної функції для побудови box plot.
- Використання списку
normal_sample_1таnormal_sample_2(у такому порядку зліва направо) як дані. - Позначення лівого box plot як
First sample, а правого — якSecond sampleза допомогоюlist.
Рішення
Дякуємо за ваш відгук!
single