Побудова Кумулятивних Розподілів
Графік ecdfplot відображає частку або кількість спостережень, що знаходяться нижче кожного унікального значення у наборі даних.
У порівнянні з гістограмою або графіком щільності, він має суттєву перевагу: кожне спостереження візуалізується безпосередньо. Це означає, що немає необхідності налаштовувати бінування чи параметри згладжування, які можуть спотворити дані. Такий спосіб часто вважається найбільш "чесним" для візуалізації розподілу.
Основні параметри
За замовчуванням графік показує частку (від 0 до 1) даних, менших за X. Ви можете змінити цю поведінку:
stat='count': замість відсотка по осі Y відображається кількість спостережень;complementary=True: змінює логіку. Замість відображення значень нижче порогу, показує значення вище нього. Це, по суті, "крива виживання" (наприклад, "Скільки пінгвінів мають дзьоб довший за 50 мм?").
Приклад
Ось як параметр complementary змінює візуалізацію. Крива йде вниз замість того, щоб підніматися.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Аналіз довжин дзьобів пінгвінів для визначення кількості особин, у яких довжина перевищує певне значення.
- Імпортувати
pandas,seabornтаmatplotlib.pyplot. - Зчитати набір даних penguins.
- Створити ECDF-графік:
- Встановити
xяк'bill_length_mm'. - Групувати за
'island'за допомогоюhue. - Увімкнути режим "survival", встановивши
complementary=True. - Показати абсолютні значення, встановивши
stat='count'. - Використати палітру
'mako'. - Використати змінну
dfяк дані.
- Відобразити графік.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Чудово!
Completion показник покращився до 4.55
Побудова Кумулятивних Розподілів
Свайпніть щоб показати меню
Графік ecdfplot відображає частку або кількість спостережень, що знаходяться нижче кожного унікального значення у наборі даних.
У порівнянні з гістограмою або графіком щільності, він має суттєву перевагу: кожне спостереження візуалізується безпосередньо. Це означає, що немає необхідності налаштовувати бінування чи параметри згладжування, які можуть спотворити дані. Такий спосіб часто вважається найбільш "чесним" для візуалізації розподілу.
Основні параметри
За замовчуванням графік показує частку (від 0 до 1) даних, менших за X. Ви можете змінити цю поведінку:
stat='count': замість відсотка по осі Y відображається кількість спостережень;complementary=True: змінює логіку. Замість відображення значень нижче порогу, показує значення вище нього. Це, по суті, "крива виживання" (наприклад, "Скільки пінгвінів мають дзьоб довший за 50 мм?").
Приклад
Ось як параметр complementary змінює візуалізацію. Крива йде вниз замість того, щоб підніматися.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Аналіз довжин дзьобів пінгвінів для визначення кількості особин, у яких довжина перевищує певне значення.
- Імпортувати
pandas,seabornтаmatplotlib.pyplot. - Зчитати набір даних penguins.
- Створити ECDF-графік:
- Встановити
xяк'bill_length_mm'. - Групувати за
'island'за допомогоюhue. - Увімкнути режим "survival", встановивши
complementary=True. - Показати абсолютні значення, встановивши
stat='count'. - Використати палітру
'mako'. - Використати змінну
dfяк дані.
- Відобразити графік.
Рішення
Дякуємо за ваш відгук!
single