Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Побудова Кумулятивних Розподілів | Розділ
Статистична візуалізація з Seaborn

bookПобудова Кумулятивних Розподілів

Графік ecdfplot відображає частку або кількість спостережень, що знаходяться нижче кожного унікального значення у наборі даних.

У порівнянні з гістограмою або графіком щільності, він має суттєву перевагу: кожне спостереження візуалізується безпосередньо. Це означає, що немає необхідності налаштовувати бінування чи параметри згладжування, які можуть спотворити дані. Такий спосіб часто вважається найбільш "чесним" для візуалізації розподілу.

Основні параметри

За замовчуванням графік показує частку (від 0 до 1) даних, менших за X. Ви можете змінити цю поведінку:

  • stat='count': замість відсотка по осі Y відображається кількість спостережень;
  • complementary=True: змінює логіку. Замість відображення значень нижче порогу, показує значення вище нього. Це, по суті, "крива виживання" (наприклад, "Скільки пінгвінів мають дзьоб довший за 50 мм?").

Приклад

Ось як параметр complementary змінює візуалізацію. Крива йде вниз замість того, щоб підніматися.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Завдання

Swipe to start coding

Аналіз довжин дзьобів пінгвінів для визначення кількості особин, у яких довжина перевищує певне значення.

  1. Імпортувати pandas, seaborn та matplotlib.pyplot.
  2. Зчитати набір даних penguins.
  3. Створити ECDF-графік:
  • Встановити x як 'bill_length_mm'.
  • Групувати за 'island' за допомогою hue.
  • Увімкнути режим "survival", встановивши complementary=True.
  • Показати абсолютні значення, встановивши stat='count'.
  • Використати палітру 'mako'.
  • Використати змінну df як дані.
  1. Відобразити графік.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 7
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

bookПобудова Кумулятивних Розподілів

Свайпніть щоб показати меню

Графік ecdfplot відображає частку або кількість спостережень, що знаходяться нижче кожного унікального значення у наборі даних.

У порівнянні з гістограмою або графіком щільності, він має суттєву перевагу: кожне спостереження візуалізується безпосередньо. Це означає, що немає необхідності налаштовувати бінування чи параметри згладжування, які можуть спотворити дані. Такий спосіб часто вважається найбільш "чесним" для візуалізації розподілу.

Основні параметри

За замовчуванням графік показує частку (від 0 до 1) даних, менших за X. Ви можете змінити цю поведінку:

  • stat='count': замість відсотка по осі Y відображається кількість спостережень;
  • complementary=True: змінює логіку. Замість відображення значень нижче порогу, показує значення вище нього. Це, по суті, "крива виживання" (наприклад, "Скільки пінгвінів мають дзьоб довший за 50 мм?").

Приклад

Ось як параметр complementary змінює візуалізацію. Крива йде вниз замість того, щоб підніматися.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Завдання

Swipe to start coding

Аналіз довжин дзьобів пінгвінів для визначення кількості особин, у яких довжина перевищує певне значення.

  1. Імпортувати pandas, seaborn та matplotlib.pyplot.
  2. Зчитати набір даних penguins.
  3. Створити ECDF-графік:
  • Встановити x як 'bill_length_mm'.
  • Групувати за 'island' за допомогою hue.
  • Увімкнути режим "survival", встановивши complementary=True.
  • Показати абсолютні значення, встановивши stat='count'.
  • Використати палітру 'mako'.
  • Використати змінну df як дані.
  1. Відобразити графік.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 7
single

single

some-alt