Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen KDE-Diagramm | Visualisierung mit Seaborn
Ultimative Visualisierung mit Python
course content

Kursinhalt

Ultimative Visualisierung mit Python

Ultimative Visualisierung mit Python

1. Einführung in Matplotlib
2. Erstellen Häufig Verwendeter Diagramme
3. Anpassung von Plots
4. Mehr Statistische Diagramme
5. Visualisierung mit Seaborn

book
KDE-Diagramm

Kernel-Dichteschätzung (KDE) Plot ist ein Diagramm, das zur Visualisierung der Wahrscheinlichkeitsdichtefunktion verwendet wird. Es ist in gewisser Weise einem Histogramm ähnlich, das wir im vorherigen Abschnitt besprochen haben, jedoch ist der KDE-Plot eine kontinuierliche Kurve, nicht eine Reihe von Balken, und basiert auf allen Datenpunkten anstatt auf den Intervallen. Schauen wir uns ein Beispiel für einen KDE-Plot an:

Wie Sie sehen können, haben wir hier ein Histogramm kombiniert mit einem KDE-Plot (orange Kurve). Diese Kombination gibt uns eine viel klarere Annäherung der Wahrscheinlichkeitsdichtefunktion als ein einzelnes Histogramm.

Mit seaborn ist das Erstellen eines KDE-Plots so einfach wie möglich, da es eine spezielle kdeplot() Funktion gibt. Ihre wichtigsten Parameter data, x und y funktionieren genauso wie in der countplot() Funktion.

Erste Option

Wir können einfach nur einen dieser Parameter festlegen, indem wir eine Reihe von Werten übergeben. Hier ist ein Beispiel, um alles zu verdeutlichen:

123456789
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Wir setzen nur den Wert für den data-Parameter, indem wir ein Series-Objekt übergeben und den fill-Parameter verwenden, um die Fläche unter der Kurve auszufüllen (sie ist standardmäßig nicht ausgefüllt).

Zweite Option

Es ist auch möglich, ein 2D-Objekt wie ein DataFrame für data und einen Spaltennamen (oder einen Schlüssel, wenn data ein Wörterbuch ist) für x (vertikale Orientierung) oder y (horizontale Orientierung) festzulegen:

12345678
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

Wir haben die gleichen Ergebnisse erzielt, indem wir das gesamte DataFrame als data-Parameter und den Spaltennamen für den x-Parameter übergeben haben.

Übrigens hat das von uns erstellte KDE-Diagramm eine charakteristische Glockenkurve und ähnelt stark der Normalverteilung mit einem Mittelwert von ungefähr 52°F.

Falls Sie mehr über die Funktion kdeplot() erfahren möchten, können Sie gerne die Dokumentation konsultieren.

Aufgabe

Swipe to start coding

  1. Verwenden Sie die richtige Funktion, um ein KDE-Diagramm zu erstellen.
  2. Verwenden Sie countries_df als Daten für das Diagramm (das erste Argument).
  3. Setzen Sie 'GDP per capita' als die zu verwendende Spalte und die Ausrichtung auf horizontal über das zweite Argument.
  4. Füllen Sie den Bereich unter der Kurve über das dritte (rechtsstehende) Argument aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 4
toggle bottom row

book
KDE-Diagramm

Kernel-Dichteschätzung (KDE) Plot ist ein Diagramm, das zur Visualisierung der Wahrscheinlichkeitsdichtefunktion verwendet wird. Es ist in gewisser Weise einem Histogramm ähnlich, das wir im vorherigen Abschnitt besprochen haben, jedoch ist der KDE-Plot eine kontinuierliche Kurve, nicht eine Reihe von Balken, und basiert auf allen Datenpunkten anstatt auf den Intervallen. Schauen wir uns ein Beispiel für einen KDE-Plot an:

Wie Sie sehen können, haben wir hier ein Histogramm kombiniert mit einem KDE-Plot (orange Kurve). Diese Kombination gibt uns eine viel klarere Annäherung der Wahrscheinlichkeitsdichtefunktion als ein einzelnes Histogramm.

Mit seaborn ist das Erstellen eines KDE-Plots so einfach wie möglich, da es eine spezielle kdeplot() Funktion gibt. Ihre wichtigsten Parameter data, x und y funktionieren genauso wie in der countplot() Funktion.

Erste Option

Wir können einfach nur einen dieser Parameter festlegen, indem wir eine Reihe von Werten übergeben. Hier ist ein Beispiel, um alles zu verdeutlichen:

123456789
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Wir setzen nur den Wert für den data-Parameter, indem wir ein Series-Objekt übergeben und den fill-Parameter verwenden, um die Fläche unter der Kurve auszufüllen (sie ist standardmäßig nicht ausgefüllt).

Zweite Option

Es ist auch möglich, ein 2D-Objekt wie ein DataFrame für data und einen Spaltennamen (oder einen Schlüssel, wenn data ein Wörterbuch ist) für x (vertikale Orientierung) oder y (horizontale Orientierung) festzulegen:

12345678
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

Wir haben die gleichen Ergebnisse erzielt, indem wir das gesamte DataFrame als data-Parameter und den Spaltennamen für den x-Parameter übergeben haben.

Übrigens hat das von uns erstellte KDE-Diagramm eine charakteristische Glockenkurve und ähnelt stark der Normalverteilung mit einem Mittelwert von ungefähr 52°F.

Falls Sie mehr über die Funktion kdeplot() erfahren möchten, können Sie gerne die Dokumentation konsultieren.

Aufgabe

Swipe to start coding

  1. Verwenden Sie die richtige Funktion, um ein KDE-Diagramm zu erstellen.
  2. Verwenden Sie countries_df als Daten für das Diagramm (das erste Argument).
  3. Setzen Sie 'GDP per capita' als die zu verwendende Spalte und die Ausrichtung auf horizontal über das zweite Argument.
  4. Füllen Sie den Bereich unter der Kurve über das dritte (rechtsstehende) Argument aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 4
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
We're sorry to hear that something went wrong. What happened?
some-alt