Графік KDE
Оцінка щільності ядра (KDE-графік) — це тип графіка, який відображає оцінену функцію щільності ймовірності для неперервної змінної. На відміну від гістограми, яка показує дані у вигляді дискретних стовпчиків, згрупованих за інтервалами, KDE-графік представляє розподіл як плавну, неперервну криву на основі всіх точок даних.
У цьому прикладі показано гістограму у поєднанні з KDE-графіком (помаранчева крива), що забезпечує більш точне наближення функції щільності ймовірності, ніж лише гістограма.
У seaborn
функція kdeplot()
дозволяє легко створювати KDE-графіки. Основні параметри — data
, x
та y
— працюють так само, як і у countplot()
.
Перший варіант
Можна встановити лише один із параметрів, передаючи послідовність значень, що дозволяє індивідуально налаштовувати кожен елемент.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
Параметр data
встановлюється шляхом передачі об'єкта Series, а параметр fill
використовується для заповнення області під кривою, яка за замовчуванням не заповнена.
Другий варіант
Також можливо встановити 2D-об'єкт, наприклад DataFrame, для параметра data
та вказати назву стовпця або ключ, якщо data
є словником, для x
(вертикальна орієнтація) або y
(горизонтальна орієнтація):
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Той самий результат було досягнуто шляхом передачі всього DataFrame
як параметра data
та вказання назви стовпця для параметра x
.
Побудований KDE-графік має характерну форму дзвону, що нагадує нормальний розподіл із середнім значенням близько 52°F.
Якщо бажаєте детальніше ознайомитися з функцією KDE plot, зверніться до документації kdeplot()
.
Swipe to start coding
- Використання відповідної функції для створення KDE-графіка.
- Використання
countries_df
як даних для побудови графіка (перший аргумент). - Встановлення стовпця
'GDP per capita'
для побудови та горизонтальної орієнтації через другий аргумент. - Заповнення області під кривою за допомогою третього (правого) аргументу.
Рішення
Дякуємо за ваш відгук!