Kursinhalt
Ultimative Visualisierung mit Python
Ultimative Visualisierung mit Python
KDE-Diagramm
Kernel-Dichteschätzung (KDE) Plot ist ein Diagramm, das zur Visualisierung der Wahrscheinlichkeitsdichtefunktion verwendet wird. Es ist in gewisser Weise einem Histogramm ähnlich, das wir im vorherigen Abschnitt besprochen haben, jedoch ist der KDE-Plot eine kontinuierliche Kurve, nicht eine Reihe von Balken, und basiert auf allen Datenpunkten anstatt auf den Intervallen. Schauen wir uns ein Beispiel für einen KDE-Plot an:
Wie Sie sehen können, haben wir hier ein Histogramm kombiniert mit einem KDE-Plot (orange Kurve). Diese Kombination gibt uns eine viel klarere Annäherung der Wahrscheinlichkeitsdichtefunktion als ein einzelnes Histogramm.
Mit seaborn
ist das Erstellen eines KDE-Plots so einfach wie möglich, da es eine spezielle kdeplot()
Funktion gibt. Ihre wichtigsten Parameter data
, x
und y
funktionieren genauso wie in der countplot()
Funktion.
Erste Option
Wir können einfach nur einen dieser Parameter festlegen, indem wir eine Reihe von Werten übergeben. Hier ist ein Beispiel, um alles zu verdeutlichen:
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
Wir setzen nur den Wert für den data
-Parameter, indem wir ein Series
-Objekt übergeben und den fill
-Parameter verwenden, um die Fläche unter der Kurve auszufüllen (sie ist standardmäßig nicht ausgefüllt).
Zweite Option
Es ist auch möglich, ein 2D-Objekt wie ein DataFrame
für data
und einen Spaltennamen (oder einen Schlüssel, wenn data
ein Wörterbuch ist) für x
(vertikale Orientierung) oder y
(horizontale Orientierung) festzulegen:
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Wir haben die gleichen Ergebnisse erzielt, indem wir das gesamte DataFrame
als data
-Parameter und den Spaltennamen für den x
-Parameter übergeben haben.
Übrigens hat das von uns erstellte KDE-Diagramm eine charakteristische Glockenkurve und ähnelt stark der Normalverteilung mit einem Mittelwert von ungefähr 52°F.
Falls Sie mehr über die Funktion kdeplot()
erfahren möchten, können Sie gerne die Dokumentation konsultieren.
Swipe to start coding
- Verwenden Sie die richtige Funktion, um ein KDE-Diagramm zu erstellen.
- Verwenden Sie
countries_df
als Daten für das Diagramm (das erste Argument). - Setzen Sie
'GDP per capita'
als die zu verwendende Spalte und die Ausrichtung auf horizontal über das zweite Argument. - Füllen Sie den Bereich unter der Kurve über das dritte (rechtsstehende) Argument aus.
Lösung
Danke für Ihr Feedback!
KDE-Diagramm
Kernel-Dichteschätzung (KDE) Plot ist ein Diagramm, das zur Visualisierung der Wahrscheinlichkeitsdichtefunktion verwendet wird. Es ist in gewisser Weise einem Histogramm ähnlich, das wir im vorherigen Abschnitt besprochen haben, jedoch ist der KDE-Plot eine kontinuierliche Kurve, nicht eine Reihe von Balken, und basiert auf allen Datenpunkten anstatt auf den Intervallen. Schauen wir uns ein Beispiel für einen KDE-Plot an:
Wie Sie sehen können, haben wir hier ein Histogramm kombiniert mit einem KDE-Plot (orange Kurve). Diese Kombination gibt uns eine viel klarere Annäherung der Wahrscheinlichkeitsdichtefunktion als ein einzelnes Histogramm.
Mit seaborn
ist das Erstellen eines KDE-Plots so einfach wie möglich, da es eine spezielle kdeplot()
Funktion gibt. Ihre wichtigsten Parameter data
, x
und y
funktionieren genauso wie in der countplot()
Funktion.
Erste Option
Wir können einfach nur einen dieser Parameter festlegen, indem wir eine Reihe von Werten übergeben. Hier ist ein Beispiel, um alles zu verdeutlichen:
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
Wir setzen nur den Wert für den data
-Parameter, indem wir ein Series
-Objekt übergeben und den fill
-Parameter verwenden, um die Fläche unter der Kurve auszufüllen (sie ist standardmäßig nicht ausgefüllt).
Zweite Option
Es ist auch möglich, ein 2D-Objekt wie ein DataFrame
für data
und einen Spaltennamen (oder einen Schlüssel, wenn data
ein Wörterbuch ist) für x
(vertikale Orientierung) oder y
(horizontale Orientierung) festzulegen:
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Wir haben die gleichen Ergebnisse erzielt, indem wir das gesamte DataFrame
als data
-Parameter und den Spaltennamen für den x
-Parameter übergeben haben.
Übrigens hat das von uns erstellte KDE-Diagramm eine charakteristische Glockenkurve und ähnelt stark der Normalverteilung mit einem Mittelwert von ungefähr 52°F.
Falls Sie mehr über die Funktion kdeplot()
erfahren möchten, können Sie gerne die Dokumentation konsultieren.
Swipe to start coding
- Verwenden Sie die richtige Funktion, um ein KDE-Diagramm zu erstellen.
- Verwenden Sie
countries_df
als Daten für das Diagramm (das erste Argument). - Setzen Sie
'GDP per capita'
als die zu verwendende Spalte und die Ausrichtung auf horizontal über das zweite Argument. - Füllen Sie den Bereich unter der Kurve über das dritte (rechtsstehende) Argument aus.
Lösung
Danke für Ihr Feedback!