Dichteschätzung mit KDE
Ein kdeplot (Kerndichteschätzung) ist eine Methode zur Visualisierung der Verteilung von Beobachtungen in einem Datensatz. Er ist einem Histogramm ähnlich, verwendet jedoch anstelle von diskreten Bins eine kontinuierliche Wahrscheinlichkeitsdichtekurve zur Darstellung der Daten.
Dies eignet sich hervorragend, um die "Form" der Daten zu erkennen und Spitzen zu identifizieren, ohne die Unregelmäßigkeiten eines Histogramms.
Visualisierung überlappender Verteilungen
Bei mehreren Kategorien (mittels hue) können einfache Linien schwer unterscheidbar sein. Seaborn bietet Parameter zur Verbesserung der Darstellung:
- Stacking (
multiple='stack'): Anstatt Linien übereinander zu zeichnen, werden diese gestapelt. Dies zeigt, wie verschiedene Kategorien zur Gesamtdistribution beitragen; - Filling (
fill=True): Füllt den Bereich unter der Kurve mit Farbe aus, wodurch das visuelle Gewicht jeder Kategorie deutlicher wird.
Beispiel:
12345678910111213141516import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
Swipe to start coding
Visualisierung der Verteilung der maximalen Temperaturen im Jahresverlauf:
- Import von
pandas,seabornundmatplotlib.pyplot. - Einlesen des Wetter-Datensatzes.
- Festlegen des Stils auf
'ticks'mit der Hintergrundfarbe'lightcyan'(bereits vorgegeben). - Erstellen eines KDE-Diagramms mit folgenden Parametern:
- Setzen von
xauf'max_temp'; - Gruppierung nach
'month'mittelshue; - Stapeln der Verteilungen mit
multiple='stack'; - Ausfüllen der Kurven mit
fill=True; - Deaktivieren der Legende (
legend=False), um das Diagramm übersichtlich zu halten.
- Anzeige des Diagramms.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 4.55
Dichteschätzung mit KDE
Swipe um das Menü anzuzeigen
Ein kdeplot (Kerndichteschätzung) ist eine Methode zur Visualisierung der Verteilung von Beobachtungen in einem Datensatz. Er ist einem Histogramm ähnlich, verwendet jedoch anstelle von diskreten Bins eine kontinuierliche Wahrscheinlichkeitsdichtekurve zur Darstellung der Daten.
Dies eignet sich hervorragend, um die "Form" der Daten zu erkennen und Spitzen zu identifizieren, ohne die Unregelmäßigkeiten eines Histogramms.
Visualisierung überlappender Verteilungen
Bei mehreren Kategorien (mittels hue) können einfache Linien schwer unterscheidbar sein. Seaborn bietet Parameter zur Verbesserung der Darstellung:
- Stacking (
multiple='stack'): Anstatt Linien übereinander zu zeichnen, werden diese gestapelt. Dies zeigt, wie verschiedene Kategorien zur Gesamtdistribution beitragen; - Filling (
fill=True): Füllt den Bereich unter der Kurve mit Farbe aus, wodurch das visuelle Gewicht jeder Kategorie deutlicher wird.
Beispiel:
12345678910111213141516import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
Swipe to start coding
Visualisierung der Verteilung der maximalen Temperaturen im Jahresverlauf:
- Import von
pandas,seabornundmatplotlib.pyplot. - Einlesen des Wetter-Datensatzes.
- Festlegen des Stils auf
'ticks'mit der Hintergrundfarbe'lightcyan'(bereits vorgegeben). - Erstellen eines KDE-Diagramms mit folgenden Parametern:
- Setzen von
xauf'max_temp'; - Gruppierung nach
'month'mittelshue; - Stapeln der Verteilungen mit
multiple='stack'; - Ausfüllen der Kurven mit
fill=True; - Deaktivieren der Legende (
legend=False), um das Diagramm übersichtlich zu halten.
- Anzeige des Diagramms.
Lösung
Danke für Ihr Feedback!
single