Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Datenzusammenfassung mit Boxplots | Abschnitt
Statistische Visualisierung mit Seaborn

bookDatenzusammenfassung mit Boxplots

Ein boxplot ist eine standardisierte Methode zur Darstellung der Verteilung von Daten basierend auf einer Fünf-Punkte-Zusammenfassung:

  1. Minimum (niedrigster Wert ohne Ausreißer);
  2. Erstes Quartil (Q1) (25. Perzentil);
  3. Median (50. Perzentil);
  4. Drittes Quartil (Q3) (75. Perzentil);
  5. Maximum (höchster Wert ohne Ausreißer).

Warum ein Boxplot verwenden?

Das beste Werkzeug zum Vergleich von Verteilungen zwischen Gruppen. Es zeigt sofort:

  • Zentrale Tendenz: Wo befindet sich die Medianlinie?;
  • Streuung: Wie hoch ist die Box? (der Interquartilsabstand);
  • Symmetrie: Liegt der Median in der Mitte der Box?;
  • Ausreißer: Gibt es Punkte außerhalb der "Whiskers"?

Wichtige Parameter

  • saturation: steuert die Intensität der Farben (0 bis 1). Niedrigere Werte machen die Farben gedämpfter;
  • linewidth: steuert die Dicke der Boxumrandungen und "Whiskers";
  • width: steuert die Breite der Box selbst.

Beispiel

Hier ist ein Boxplot, der den Datensatz "Tips" analysiert. Beachten Sie, wie die Punkte, die Ausreißer darstellen, oberhalb der Whisker erscheinen.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Aufgabe

Swipe to start coding

Visualisierung der Entfernung von Planeten, die mit verschiedenen Methoden entdeckt wurden.

  1. Festlegen des Stils auf 'ticks'. Anpassen des Themas durch Übergeben eines Dictionaries, um den Hintergrund auf 'grey' ('figure.facecolor') und die Farben der Achsenbeschriftungen auf 'white' ('xtick.color' und 'ytick.color') zu setzen.
  2. Erstellen eines Boxplots mit dem planets-Datensatz (df):
    • Zuordnung von 'distance' zur x-Achse und 'method' zur y-Achse.
    • Festlegen der Box-width auf 0.6.
  • Erhöhen der Liniendicke mit linewidth=2.
  • Deutliche Reduzierung der Farbsättigung durch Setzen von saturation auf 0.4.
    • Verwendung der 'vlag'-Palette.
  1. Anzeige der Grafik.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 11
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookDatenzusammenfassung mit Boxplots

Swipe um das Menü anzuzeigen

Ein boxplot ist eine standardisierte Methode zur Darstellung der Verteilung von Daten basierend auf einer Fünf-Punkte-Zusammenfassung:

  1. Minimum (niedrigster Wert ohne Ausreißer);
  2. Erstes Quartil (Q1) (25. Perzentil);
  3. Median (50. Perzentil);
  4. Drittes Quartil (Q3) (75. Perzentil);
  5. Maximum (höchster Wert ohne Ausreißer).

Warum ein Boxplot verwenden?

Das beste Werkzeug zum Vergleich von Verteilungen zwischen Gruppen. Es zeigt sofort:

  • Zentrale Tendenz: Wo befindet sich die Medianlinie?;
  • Streuung: Wie hoch ist die Box? (der Interquartilsabstand);
  • Symmetrie: Liegt der Median in der Mitte der Box?;
  • Ausreißer: Gibt es Punkte außerhalb der "Whiskers"?

Wichtige Parameter

  • saturation: steuert die Intensität der Farben (0 bis 1). Niedrigere Werte machen die Farben gedämpfter;
  • linewidth: steuert die Dicke der Boxumrandungen und "Whiskers";
  • width: steuert die Breite der Box selbst.

Beispiel

Hier ist ein Boxplot, der den Datensatz "Tips" analysiert. Beachten Sie, wie die Punkte, die Ausreißer darstellen, oberhalb der Whisker erscheinen.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Aufgabe

Swipe to start coding

Visualisierung der Entfernung von Planeten, die mit verschiedenen Methoden entdeckt wurden.

  1. Festlegen des Stils auf 'ticks'. Anpassen des Themas durch Übergeben eines Dictionaries, um den Hintergrund auf 'grey' ('figure.facecolor') und die Farben der Achsenbeschriftungen auf 'white' ('xtick.color' und 'ytick.color') zu setzen.
  2. Erstellen eines Boxplots mit dem planets-Datensatz (df):
    • Zuordnung von 'distance' zur x-Achse und 'method' zur y-Achse.
    • Festlegen der Box-width auf 0.6.
  • Erhöhen der Liniendicke mit linewidth=2.
  • Deutliche Reduzierung der Farbsättigung durch Setzen von saturation auf 0.4.
    • Verwendung der 'vlag'-Palette.
  1. Anzeige der Grafik.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 11
single

single

some-alt