Visualisierung von Histogrammen
Das histplot (Histogramm-Diagramm) ist ein klassisches Werkzeug, das die Verteilung einer oder mehrerer Variablen darstellt, indem es die Anzahl der Beobachtungen zählt, die in diskrete Intervalle (Bins) fallen. Es hilft, Fragen zu beantworten wie: "Welcher Wert kommt am häufigsten vor?", "Ist die Verteilung symmetrisch?" oder "Gibt es Ausreißer?".
Anpassung des Histogramms
Standardmäßig zeichnet histplot Balken und zählt die Anzahl der Vorkommen. Sie können das Diagramm jedoch anpassen, um weitere Erkenntnisse zu gewinnen.
1. Änderung der Statistik (stat)
Anstelle einer einfachen Zählung können Sie die Dichte berechnen. Dies ist nützlich, wenn Gruppen unterschiedlicher Größe verglichen werden, da die Fläche unter der Kurve auf 1 normiert wird.
stat='density'
2. Visueller Stil (element)
Beim Plotten mehrerer Gruppen mit hue können sich Standardbalken überlappen und unübersichtlich werden. Die Verwendung eines Step-Plots erzeugt eine Umrisslinie, wodurch Überlappungen leichter erkennbar sind.
element='step'
3. Bin-Breite (binwidth)
Die Größe der Bins bestimmt, wie viele Details sichtbar sind.
binwidth=1
Beispiel: So kombinieren Sie diese Parameter, um ein Step-Filled-Dichte-Diagramm zu erstellen:
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
Swipe to start coding
Erstellung einer übersichtlichen Visualisierung der Schnabellängen der Pinguine:
- Initialisierung eines
histplotmit dem DataFramedf. - Setzen von
xauf'bill_length_mm'. - Gruppierung der Daten nach
'island'mit dem Parameterhue. - Änderung des visuellen Stils auf
'step'mit dem Parameterelement. - Umstellung der Y-Achse auf die Darstellung der
'density'mittels des Parametersstat. - Festlegung der
binwidthauf1und Verwendung der Palette'flare'. - Anzeige des Plots.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 4.55
Visualisierung von Histogrammen
Swipe um das Menü anzuzeigen
Das histplot (Histogramm-Diagramm) ist ein klassisches Werkzeug, das die Verteilung einer oder mehrerer Variablen darstellt, indem es die Anzahl der Beobachtungen zählt, die in diskrete Intervalle (Bins) fallen. Es hilft, Fragen zu beantworten wie: "Welcher Wert kommt am häufigsten vor?", "Ist die Verteilung symmetrisch?" oder "Gibt es Ausreißer?".
Anpassung des Histogramms
Standardmäßig zeichnet histplot Balken und zählt die Anzahl der Vorkommen. Sie können das Diagramm jedoch anpassen, um weitere Erkenntnisse zu gewinnen.
1. Änderung der Statistik (stat)
Anstelle einer einfachen Zählung können Sie die Dichte berechnen. Dies ist nützlich, wenn Gruppen unterschiedlicher Größe verglichen werden, da die Fläche unter der Kurve auf 1 normiert wird.
stat='density'
2. Visueller Stil (element)
Beim Plotten mehrerer Gruppen mit hue können sich Standardbalken überlappen und unübersichtlich werden. Die Verwendung eines Step-Plots erzeugt eine Umrisslinie, wodurch Überlappungen leichter erkennbar sind.
element='step'
3. Bin-Breite (binwidth)
Die Größe der Bins bestimmt, wie viele Details sichtbar sind.
binwidth=1
Beispiel: So kombinieren Sie diese Parameter, um ein Step-Filled-Dichte-Diagramm zu erstellen:
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
Swipe to start coding
Erstellung einer übersichtlichen Visualisierung der Schnabellängen der Pinguine:
- Initialisierung eines
histplotmit dem DataFramedf. - Setzen von
xauf'bill_length_mm'. - Gruppierung der Daten nach
'island'mit dem Parameterhue. - Änderung des visuellen Stils auf
'step'mit dem Parameterelement. - Umstellung der Y-Achse auf die Darstellung der
'density'mittels des Parametersstat. - Festlegung der
binwidthauf1und Verwendung der Palette'flare'. - Anzeige des Plots.
Lösung
Danke für Ihr Feedback!
single