Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen KDE-Diagramm | Visualisierung Mit Seaborn
Ultimative Visualisierung mit Python

Swipe um das Menü anzuzeigen

book
KDE-Diagramm

Note
Definition

Ein Kernel-Dichteschätzer (KDE) Plot ist eine Art von Diagramm, das die geschätzte Wahrscheinlichkeitsdichtefunktion einer kontinuierlichen Variablen visualisiert. Im Gegensatz zu einem Histogramm, das Daten mit diskreten Balken in Intervallen darstellt, zeigt ein KDE-Plot die Verteilung als glatte, kontinuierliche Kurve basierend auf allen Datenpunkten.

Dieses Beispiel zeigt ein Histogramm kombiniert mit einem KDE-Plot (orangefarbene Kurve), was eine klarere Annäherung an die Wahrscheinlichkeitsdichtefunktion bietet als das Histogramm allein.

In seaborn ermöglicht die Funktion kdeplot() das einfache Erstellen von KDE-Plots. Die wichtigsten Parameter—data, x und y—funktionieren genauso wie bei countplot().

Erste Option

Nur einer der Parameter kann durch Übergeben einer Wertesequenz gesetzt werden, was eine individuelle Anpassung der einzelnen Elemente ermöglicht.

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Der data-Parameter wird durch Übergeben eines Series-Objekts gesetzt, und der fill-Parameter wird verwendet, um den Bereich unter der Kurve auszufüllen, der standardmäßig nicht ausgefüllt ist.

Zweite Möglichkeit

Es ist auch möglich, ein 2D-Objekt wie ein DataFrame für data und einen Spaltennamen oder einen Schlüssel, falls data ein Dictionary ist, für x (vertikale Ausrichtung) oder y (horizontale Ausrichtung) zu setzen:

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

Das gleiche Ergebnis wurde erzielt, indem das gesamte DataFrame als data-Parameter übergeben und der Spaltenname für den x-Parameter angegeben wurde.

Note
Hinweis

Das erstellte KDE-Diagramm zeigt eine charakteristische Glockenkurve, die einer Normalverteilung mit einem Mittelwert von etwa 52°F ähnelt.

Note
Mehr erfahren

Falls Sie sich weiter über die KDE-Plot-Funktion informieren möchten, können Sie gerne die kdeplot()-Dokumentation konsultieren.

Aufgabe

Swipe to start coding

  1. Die korrekte Funktion zur Erstellung eines KDE-Plots verwenden.
  2. countries_df als Datensatz für das Diagramm nutzen (erstes Argument).
  3. Die Spalte 'GDP per capita' auswählen und die Ausrichtung über das zweite Argument auf horizontal setzen.
  4. Den Bereich unter der Kurve über das dritte (rechte) Argument ausfüllen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 4

Fragen Sie AI

expand
ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

book
KDE-Diagramm

Note
Definition

Ein Kernel-Dichteschätzer (KDE) Plot ist eine Art von Diagramm, das die geschätzte Wahrscheinlichkeitsdichtefunktion einer kontinuierlichen Variablen visualisiert. Im Gegensatz zu einem Histogramm, das Daten mit diskreten Balken in Intervallen darstellt, zeigt ein KDE-Plot die Verteilung als glatte, kontinuierliche Kurve basierend auf allen Datenpunkten.

Dieses Beispiel zeigt ein Histogramm kombiniert mit einem KDE-Plot (orangefarbene Kurve), was eine klarere Annäherung an die Wahrscheinlichkeitsdichtefunktion bietet als das Histogramm allein.

In seaborn ermöglicht die Funktion kdeplot() das einfache Erstellen von KDE-Plots. Die wichtigsten Parameter—data, x und y—funktionieren genauso wie bei countplot().

Erste Option

Nur einer der Parameter kann durch Übergeben einer Wertesequenz gesetzt werden, was eine individuelle Anpassung der einzelnen Elemente ermöglicht.

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Der data-Parameter wird durch Übergeben eines Series-Objekts gesetzt, und der fill-Parameter wird verwendet, um den Bereich unter der Kurve auszufüllen, der standardmäßig nicht ausgefüllt ist.

Zweite Möglichkeit

Es ist auch möglich, ein 2D-Objekt wie ein DataFrame für data und einen Spaltennamen oder einen Schlüssel, falls data ein Dictionary ist, für x (vertikale Ausrichtung) oder y (horizontale Ausrichtung) zu setzen:

123456789101112
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

Das gleiche Ergebnis wurde erzielt, indem das gesamte DataFrame als data-Parameter übergeben und der Spaltenname für den x-Parameter angegeben wurde.

Note
Hinweis

Das erstellte KDE-Diagramm zeigt eine charakteristische Glockenkurve, die einer Normalverteilung mit einem Mittelwert von etwa 52°F ähnelt.

Note
Mehr erfahren

Falls Sie sich weiter über die KDE-Plot-Funktion informieren möchten, können Sie gerne die kdeplot()-Dokumentation konsultieren.

Aufgabe

Swipe to start coding

  1. Die korrekte Funktion zur Erstellung eines KDE-Plots verwenden.
  2. countries_df als Datensatz für das Diagramm nutzen (erstes Argument).
  3. Die Spalte 'GDP per capita' auswählen und die Ausrichtung über das zweite Argument auf horizontal setzen.
  4. Den Bereich unter der Kurve über das dritte (rechte) Argument ausfüllen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 4
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
Wir sind enttäuscht, dass etwas schief gelaufen ist. Was ist passiert?
some-alt