Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære KDE-Plot | Visualisering med Seaborn
Ultimativ Visualisering med Python

Stryg for at vise menuen

book
KDE-Plot

Note
Definition

Et Kernel Density Estimation (KDE) plot er en type plot, der visualiserer den estimerede sandsynlighedstæthedsfunktion for en kontinuerlig variabel. I modsætning til et histogram, som viser data ved hjælp af diskrete søjler grupperet i intervaller, repræsenterer et KDE-plot fordelingen som en glat, kontinuerlig kurve baseret på alle datapunkter.

Dette eksempel viser et histogram kombineret med et KDE-plot (orange kurve), hvilket giver en tydeligere tilnærmelse af sandsynlighedstæthedsfunktionen end histogrammet alene.

I seaborn gør funktionen kdeplot() det nemt at oprette KDE-plots. Dens vigtigste parametre—data, x og y—fungerer på samme måde som i countplot().

Første mulighed

Kun én af parametrene kan indstilles ved at angive en sekvens af værdier, hvilket muliggør individuel tilpasning på tværs af elementer.

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Parameteren data angives ved at videregive et Series-objekt, og parameteren fill bruges til at udfylde området under kurven, som som standard ikke er udfyldt.

Anden mulighed

Det er også muligt at angive et 2D-objekt som en DataFrame for data og et kolonnenavn eller en nøgle, hvis data er en ordbog, for x (vertikal orientering) eller y (horisontal orientering):

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

De samme resultater blev opnået ved at videregive hele DataFrame som data-parameteren og angive kolonnenavnet for x-parameteren.

Note
Bemærk

Det oprettede KDE-plot udviser en karakteristisk klokkeformet kurve, der tæt ligner en normalfordeling med et gennemsnit omkring 52°F.

Note
Læs Mere

Hvis du ønsker at udforske mere om KDE plot-funktionen, kan du finde yderligere information i kdeplot() dokumentationen.

Opgave

Swipe to start coding

  1. Brug den korrekte funktion til at oprette et KDE-plot.
  2. Brug countries_df som data til plottet (det første argument).
  3. Angiv 'GDP per capita' som kolonnen, der skal bruges, og orienteringen til vandret via det andet argument.
  4. Udfyld området under kurven via det tredje (yderste højre) argument.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 4

Spørg AI

expand
ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

book
KDE-Plot

Note
Definition

Et Kernel Density Estimation (KDE) plot er en type plot, der visualiserer den estimerede sandsynlighedstæthedsfunktion for en kontinuerlig variabel. I modsætning til et histogram, som viser data ved hjælp af diskrete søjler grupperet i intervaller, repræsenterer et KDE-plot fordelingen som en glat, kontinuerlig kurve baseret på alle datapunkter.

Dette eksempel viser et histogram kombineret med et KDE-plot (orange kurve), hvilket giver en tydeligere tilnærmelse af sandsynlighedstæthedsfunktionen end histogrammet alene.

I seaborn gør funktionen kdeplot() det nemt at oprette KDE-plots. Dens vigtigste parametre—data, x og y—fungerer på samme måde som i countplot().

Første mulighed

Kun én af parametrene kan indstilles ved at angive en sekvens af værdier, hvilket muliggør individuel tilpasning på tværs af elementer.

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Parameteren data angives ved at videregive et Series-objekt, og parameteren fill bruges til at udfylde området under kurven, som som standard ikke er udfyldt.

Anden mulighed

Det er også muligt at angive et 2D-objekt som en DataFrame for data og et kolonnenavn eller en nøgle, hvis data er en ordbog, for x (vertikal orientering) eller y (horisontal orientering):

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

De samme resultater blev opnået ved at videregive hele DataFrame som data-parameteren og angive kolonnenavnet for x-parameteren.

Note
Bemærk

Det oprettede KDE-plot udviser en karakteristisk klokkeformet kurve, der tæt ligner en normalfordeling med et gennemsnit omkring 52°F.

Note
Læs Mere

Hvis du ønsker at udforske mere om KDE plot-funktionen, kan du finde yderligere information i kdeplot() dokumentationen.

Opgave

Swipe to start coding

  1. Brug den korrekte funktion til at oprette et KDE-plot.
  2. Brug countries_df som data til plottet (det første argument).
  3. Angiv 'GDP per capita' som kolonnen, der skal bruges, og orienteringen til vandret via det andet argument.
  4. Udfyld området under kurven via det tredje (yderste højre) argument.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 4
Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Vi beklager, at noget gik galt. Hvad skete der?
some-alt