Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Schätzung von Mittelwerten mit Balkendiagrammen | Abschnitt
Practice
Projects
Quizzes & Challenges
Quizze
Challenges
/
Statistische Visualisierung mit Seaborn

bookSchätzung von Mittelwerten mit Balkendiagrammen

Ein barplot stellt eine Schätzung der zentralen Tendenz (in der Regel den Mittelwert) einer numerischen Variable durch die Höhe jedes Rechtecks dar.

Im Gegensatz zu einem Histogramm, das zählt, wie viele Elemente sich in einem Intervall befinden, berechnet ein Barplot eine Statistik (wie den durchschnittlichen Rechnungsbetrag) für jede Kategorie.

Die Fehlerbalken (Unsicherheit)

Die kleinen schwarzen Linien oben auf jedem Balken werden als Fehlerbalken bezeichnet. Standardmäßig zeigen sie das 95%-Konfidenzintervall an.

Um sie anzupassen, wird nun der Parameter err_kws (Error Keywords) verwendet. Dieser akzeptiert ein Dictionary mit Einstellungen, die das Aussehen dieser Linien steuern.

Wichtige Parameter

  • capsize: fügt an den Enden der Fehlerbalken eine kleine horizontale Linie ("Kappe") hinzu;
  • err_kws: ein Dictionary zur Anpassung der Fehlerbalken;
  • {'color': 'black'}: legt die Farbe fest;
  • {'linewidth': 2}: legt die Linienstärke fest;
  • estimator: standardmäßig wird der Mittelwert berechnet. Dies kann auf median, sum oder max geändert werden (erfordert das Importieren von numpy).

Beispiel

Hier ist ein Balkendiagramm, das den durchschnittlichen Gesamtbetrag mit individuell angepassten roten Fehlerbalken zeigt.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a barplot sns.barplot( data=df, x='day', y='total_bill', hue='sex', capsize=0.1, # New way to style error bars: err_kws={'color': 'red', 'linewidth': 2}, palette='pastel' ) plt.show()
copy
Aufgabe

Swipe to start coding

Berechnung und Visualisierung des durchschnittlichen Gesamtbetrags für verschiedene Wochentage, mit Vergleich zwischen Rauchern und Nichtrauchern.

  1. Stil auf 'ticks' setzen, um das Raster zu entfernen.
  2. Erstellung eines Balkendiagramms mit dem tips-Datensatz (df):
  • Zuordnung von 'day' zu x und 'total_bill' zu y.
  • Gruppierung nach 'smoker' mittels hue.
    • Fehlerbalken-capsize auf 0.1 setzen.
    • Fehlerbalkenfarbe auf 'pink' mit dem err_kws-Dictionary ändern (z. B. {'color': 'pink'}).
    • Balkenumrandung-linewidth auf 2.5 setzen.
    • Verwendung der 'magma'-Palette.
  1. Anzeige der Grafik.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 13
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookSchätzung von Mittelwerten mit Balkendiagrammen

Swipe um das Menü anzuzeigen

Ein barplot stellt eine Schätzung der zentralen Tendenz (in der Regel den Mittelwert) einer numerischen Variable durch die Höhe jedes Rechtecks dar.

Im Gegensatz zu einem Histogramm, das zählt, wie viele Elemente sich in einem Intervall befinden, berechnet ein Barplot eine Statistik (wie den durchschnittlichen Rechnungsbetrag) für jede Kategorie.

Die Fehlerbalken (Unsicherheit)

Die kleinen schwarzen Linien oben auf jedem Balken werden als Fehlerbalken bezeichnet. Standardmäßig zeigen sie das 95%-Konfidenzintervall an.

Um sie anzupassen, wird nun der Parameter err_kws (Error Keywords) verwendet. Dieser akzeptiert ein Dictionary mit Einstellungen, die das Aussehen dieser Linien steuern.

Wichtige Parameter

  • capsize: fügt an den Enden der Fehlerbalken eine kleine horizontale Linie ("Kappe") hinzu;
  • err_kws: ein Dictionary zur Anpassung der Fehlerbalken;
  • {'color': 'black'}: legt die Farbe fest;
  • {'linewidth': 2}: legt die Linienstärke fest;
  • estimator: standardmäßig wird der Mittelwert berechnet. Dies kann auf median, sum oder max geändert werden (erfordert das Importieren von numpy).

Beispiel

Hier ist ein Balkendiagramm, das den durchschnittlichen Gesamtbetrag mit individuell angepassten roten Fehlerbalken zeigt.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a barplot sns.barplot( data=df, x='day', y='total_bill', hue='sex', capsize=0.1, # New way to style error bars: err_kws={'color': 'red', 'linewidth': 2}, palette='pastel' ) plt.show()
copy
Aufgabe

Swipe to start coding

Berechnung und Visualisierung des durchschnittlichen Gesamtbetrags für verschiedene Wochentage, mit Vergleich zwischen Rauchern und Nichtrauchern.

  1. Stil auf 'ticks' setzen, um das Raster zu entfernen.
  2. Erstellung eines Balkendiagramms mit dem tips-Datensatz (df):
  • Zuordnung von 'day' zu x und 'total_bill' zu y.
  • Gruppierung nach 'smoker' mittels hue.
    • Fehlerbalken-capsize auf 0.1 setzen.
    • Fehlerbalkenfarbe auf 'pink' mit dem err_kws-Dictionary ändern (z. B. {'color': 'pink'}).
    • Balkenumrandung-linewidth auf 2.5 setzen.
    • Verwendung der 'magma'-Palette.
  1. Anzeige der Grafik.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 13
single

single

some-alt