Узагальнення Даних за Допомогою Box Plot
boxplot — це стандартизований спосіб відображення розподілу даних на основі п’ятичислового підсумку:
- Мінімум (найменше значення, не враховуючи викиди);
- Перший квартиль (Q1) (25-й перцентиль);
- Медіана (50-й перцентиль);
- Третій квартиль (Q3) (75-й перцентиль);
- Максимум (найбільше значення, не враховуючи викиди).
Чому використовують boxplot?
Це найкращий інструмент для порівняння розподілів між групами. Він одразу показує:
- Центральна тенденція: де знаходиться лінія медіани?;
- Розмах: якої висоти коробка? (міжквартильний розмах);
- Симетрія: чи знаходиться медіана по центру коробки?;
- Викиди: чи є точки за межами "вусів"?
Основні параметри
saturation: керує інтенсивністю кольорів (від 0 до 1). Менші значення роблять кольори менш насиченими;linewidth: керує товщиною контурів коробки та "вусів";width: керує шириною самої коробки.
Приклад
Ось boxplot для аналізу набору даних "Tips". Зверніть увагу, що точки, які представляють викиди, розташовані вище за вуса.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Візуалізація відстані планет, відкритих різними методами.
- Встановити стиль на
'ticks'. Налаштувати тему, передавши словник для зміни фону на'grey'('figure.facecolor') і кольору міток осей на'white'('xtick.color'та'ytick.color'). - Створити boxplot з використанням набору даних
planets(df):
- Відобразити
'distance'по осіx, а'method'по осіy. - Встановити ширину коробки (
width) на0.6. - Зробити лінії товстішими, використовуючи
linewidth=2. - Значно приглушити кольори, встановивши
saturationна0.4. - Використати палітру
'vlag'.
- Відобразити графік.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Чудово!
Completion показник покращився до 4.55
Узагальнення Даних за Допомогою Box Plot
Свайпніть щоб показати меню
boxplot — це стандартизований спосіб відображення розподілу даних на основі п’ятичислового підсумку:
- Мінімум (найменше значення, не враховуючи викиди);
- Перший квартиль (Q1) (25-й перцентиль);
- Медіана (50-й перцентиль);
- Третій квартиль (Q3) (75-й перцентиль);
- Максимум (найбільше значення, не враховуючи викиди).
Чому використовують boxplot?
Це найкращий інструмент для порівняння розподілів між групами. Він одразу показує:
- Центральна тенденція: де знаходиться лінія медіани?;
- Розмах: якої висоти коробка? (міжквартильний розмах);
- Симетрія: чи знаходиться медіана по центру коробки?;
- Викиди: чи є точки за межами "вусів"?
Основні параметри
saturation: керує інтенсивністю кольорів (від 0 до 1). Менші значення роблять кольори менш насиченими;linewidth: керує товщиною контурів коробки та "вусів";width: керує шириною самої коробки.
Приклад
Ось boxplot для аналізу набору даних "Tips". Зверніть увагу, що точки, які представляють викиди, розташовані вище за вуса.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Візуалізація відстані планет, відкритих різними методами.
- Встановити стиль на
'ticks'. Налаштувати тему, передавши словник для зміни фону на'grey'('figure.facecolor') і кольору міток осей на'white'('xtick.color'та'ytick.color'). - Створити boxplot з використанням набору даних
planets(df):
- Відобразити
'distance'по осіx, а'method'по осіy. - Встановити ширину коробки (
width) на0.6. - Зробити лінії товстішими, використовуючи
linewidth=2. - Значно приглушити кольори, встановивши
saturationна0.4. - Використати палітру
'vlag'.
- Відобразити графік.
Рішення
Дякуємо за ваш відгук!
single