KDE-Plot
Een Kernel Density Estimation (KDE) plot is een type plot dat de geschatte kansdichtheidsfunctie van een continue variabele visualiseert. In tegenstelling tot een histogram, dat gegevens weergeeft met behulp van afzonderlijke balken gegroepeerd in intervallen, toont een KDE-plot de verdeling als een vloeiende, continue curve gebaseerd op alle datapunten.
Dit voorbeeld toont een histogram gecombineerd met een KDE-plot (oranje curve), wat een duidelijkere benadering van de kansdichtheidsfunctie geeft dan alleen het histogram.
In seaborn
maakt de functie kdeplot()
het eenvoudig om KDE-plots te maken. De belangrijkste parameters—data
, x
en y
—werken op dezelfde manier als in countplot()
.
Eerste optie
Slechts één van de parameters kan worden ingesteld door een reeks waarden door te geven, waardoor individuele aanpassing per element mogelijk is.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
De parameter data
wordt ingesteld door een Series-object door te geven, en de parameter fill
wordt gebruikt om het gebied onder de curve in te kleuren, wat standaard niet is ingevuld.
Tweede optie
Het is ook mogelijk om een 2D-object zoals een DataFrame voor data
in te stellen en een kolomnaam of een sleutel te gebruiken als data
een dictionary is voor x
(verticale oriëntatie) of y
(horizontale oriëntatie):
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Dezelfde resultaten werden bereikt door de volledige DataFrame
als de parameter data
door te geven en de kolomnaam voor de parameter x
te specificeren.
De gemaakte KDE-plot vertoont een karakteristieke klokvormige curve, die sterk lijkt op een normale verdeling met een gemiddelde rond 52°F.
Als u meer wilt weten over de KDE-plot functie, raadpleeg dan gerust de kdeplot()
documentatie.
Swipe to start coding
- Gebruik de juiste functie om een KDE-plot te maken.
- Gebruik
countries_df
als de data voor de plot (het eerste argument). - Stel
'GDP per capita'
in als de te gebruiken kolom en de oriëntatie op horizontaal via het tweede argument. - Vul het gebied onder de curve in via het derde (meest rechtse) argument.
Oplossing
Bedankt voor je feedback!