Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Visualisierung von Histogrammen | Abschnitt
Statistische Visualisierung mit Seaborn

bookVisualisierung von Histogrammen

Das histplot (Histogramm-Diagramm) ist ein klassisches Werkzeug, das die Verteilung einer oder mehrerer Variablen darstellt, indem es die Anzahl der Beobachtungen zählt, die in diskrete Intervalle (Bins) fallen. Es hilft, Fragen zu beantworten wie: "Welcher Wert kommt am häufigsten vor?", "Ist die Verteilung symmetrisch?" oder "Gibt es Ausreißer?".

Anpassung des Histogramms

Standardmäßig zeichnet histplot Balken und zählt die Anzahl der Vorkommen. Sie können das Diagramm jedoch anpassen, um weitere Erkenntnisse zu gewinnen.

1. Änderung der Statistik (stat)

Anstelle einer einfachen Zählung können Sie die Dichte berechnen. Dies ist nützlich, wenn Gruppen unterschiedlicher Größe verglichen werden, da die Fläche unter der Kurve auf 1 normiert wird.

stat='density'

2. Visueller Stil (element)

Beim Plotten mehrerer Gruppen mit hue können sich Standardbalken überlappen und unübersichtlich werden. Die Verwendung eines Step-Plots erzeugt eine Umrisslinie, wodurch Überlappungen leichter erkennbar sind.

element='step'

3. Bin-Breite (binwidth)

Die Größe der Bins bestimmt, wie viele Details sichtbar sind.

binwidth=1

Beispiel: So kombinieren Sie diese Parameter, um ein Step-Filled-Dichte-Diagramm zu erstellen:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Aufgabe

Swipe to start coding

Erstellung einer übersichtlichen Visualisierung der Schnabellängen der Pinguine:

  1. Initialisierung eines histplot mit dem DataFrame df.
  2. Setzen von x auf 'bill_length_mm'.
  3. Gruppierung der Daten nach 'island' mit dem Parameter hue.
  4. Änderung des visuellen Stils auf 'step' mit dem Parameter element.
  5. Umstellung der Y-Achse auf die Darstellung der 'density' mittels des Parameters stat.
  6. Festlegung der binwidth auf 1 und Verwendung der Palette 'flare'.
  7. Anzeige des Plots.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookVisualisierung von Histogrammen

Swipe um das Menü anzuzeigen

Das histplot (Histogramm-Diagramm) ist ein klassisches Werkzeug, das die Verteilung einer oder mehrerer Variablen darstellt, indem es die Anzahl der Beobachtungen zählt, die in diskrete Intervalle (Bins) fallen. Es hilft, Fragen zu beantworten wie: "Welcher Wert kommt am häufigsten vor?", "Ist die Verteilung symmetrisch?" oder "Gibt es Ausreißer?".

Anpassung des Histogramms

Standardmäßig zeichnet histplot Balken und zählt die Anzahl der Vorkommen. Sie können das Diagramm jedoch anpassen, um weitere Erkenntnisse zu gewinnen.

1. Änderung der Statistik (stat)

Anstelle einer einfachen Zählung können Sie die Dichte berechnen. Dies ist nützlich, wenn Gruppen unterschiedlicher Größe verglichen werden, da die Fläche unter der Kurve auf 1 normiert wird.

stat='density'

2. Visueller Stil (element)

Beim Plotten mehrerer Gruppen mit hue können sich Standardbalken überlappen und unübersichtlich werden. Die Verwendung eines Step-Plots erzeugt eine Umrisslinie, wodurch Überlappungen leichter erkennbar sind.

element='step'

3. Bin-Breite (binwidth)

Die Größe der Bins bestimmt, wie viele Details sichtbar sind.

binwidth=1

Beispiel: So kombinieren Sie diese Parameter, um ein Step-Filled-Dichte-Diagramm zu erstellen:

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Aufgabe

Swipe to start coding

Erstellung einer übersichtlichen Visualisierung der Schnabellängen der Pinguine:

  1. Initialisierung eines histplot mit dem DataFrame df.
  2. Setzen von x auf 'bill_length_mm'.
  3. Gruppierung der Daten nach 'island' mit dem Parameter hue.
  4. Änderung des visuellen Stils auf 'step' mit dem Parameter element.
  5. Umstellung der Y-Achse auf die Darstellung der 'density' mittels des Parameters stat.
  6. Festlegung der binwidth auf 1 und Verwendung der Palette 'flare'.
  7. Anzeige des Plots.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4
single

single

some-alt