Datenzusammenfassung mit Boxplots
Ein boxplot ist eine standardisierte Methode zur Darstellung der Verteilung von Daten basierend auf einer Fünf-Punkte-Zusammenfassung:
- Minimum (niedrigster Wert ohne Ausreißer);
- Erstes Quartil (Q1) (25. Perzentil);
- Median (50. Perzentil);
- Drittes Quartil (Q3) (75. Perzentil);
- Maximum (höchster Wert ohne Ausreißer).
Warum ein Boxplot verwenden?
Das beste Werkzeug zum Vergleich von Verteilungen zwischen Gruppen. Es zeigt sofort:
- Zentrale Tendenz: Wo befindet sich die Medianlinie?;
- Streuung: Wie hoch ist die Box? (der Interquartilsabstand);
- Symmetrie: Liegt der Median in der Mitte der Box?;
- Ausreißer: Gibt es Punkte außerhalb der "Whiskers"?
Wichtige Parameter
saturation: steuert die Intensität der Farben (0 bis 1). Niedrigere Werte machen die Farben gedämpfter;linewidth: steuert die Dicke der Boxumrandungen und "Whiskers";width: steuert die Breite der Box selbst.
Beispiel
Hier ist ein Boxplot, der den Datensatz "Tips" analysiert. Beachten Sie, wie die Punkte, die Ausreißer darstellen, oberhalb der Whisker erscheinen.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisierung der Entfernung von Planeten, die mit verschiedenen Methoden entdeckt wurden.
- Festlegen des Stils auf
'ticks'. Anpassen des Themas durch Übergeben eines Dictionaries, um den Hintergrund auf'grey'('figure.facecolor') und die Farben der Achsenbeschriftungen auf'white'('xtick.color'und'ytick.color') zu setzen. - Erstellen eines Boxplots mit dem
planets-Datensatz (df):- Zuordnung von
'distance'zurx-Achse und'method'zury-Achse. - Festlegen der Box-
widthauf0.6.
- Zuordnung von
- Erhöhen der Liniendicke mit
linewidth=2. - Deutliche Reduzierung der Farbsättigung durch Setzen von
saturationauf0.4.- Verwendung der
'vlag'-Palette.
- Verwendung der
- Anzeige der Grafik.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 4.55
Datenzusammenfassung mit Boxplots
Swipe um das Menü anzuzeigen
Ein boxplot ist eine standardisierte Methode zur Darstellung der Verteilung von Daten basierend auf einer Fünf-Punkte-Zusammenfassung:
- Minimum (niedrigster Wert ohne Ausreißer);
- Erstes Quartil (Q1) (25. Perzentil);
- Median (50. Perzentil);
- Drittes Quartil (Q3) (75. Perzentil);
- Maximum (höchster Wert ohne Ausreißer).
Warum ein Boxplot verwenden?
Das beste Werkzeug zum Vergleich von Verteilungen zwischen Gruppen. Es zeigt sofort:
- Zentrale Tendenz: Wo befindet sich die Medianlinie?;
- Streuung: Wie hoch ist die Box? (der Interquartilsabstand);
- Symmetrie: Liegt der Median in der Mitte der Box?;
- Ausreißer: Gibt es Punkte außerhalb der "Whiskers"?
Wichtige Parameter
saturation: steuert die Intensität der Farben (0 bis 1). Niedrigere Werte machen die Farben gedämpfter;linewidth: steuert die Dicke der Boxumrandungen und "Whiskers";width: steuert die Breite der Box selbst.
Beispiel
Hier ist ein Boxplot, der den Datensatz "Tips" analysiert. Beachten Sie, wie die Punkte, die Ausreißer darstellen, oberhalb der Whisker erscheinen.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisierung der Entfernung von Planeten, die mit verschiedenen Methoden entdeckt wurden.
- Festlegen des Stils auf
'ticks'. Anpassen des Themas durch Übergeben eines Dictionaries, um den Hintergrund auf'grey'('figure.facecolor') und die Farben der Achsenbeschriftungen auf'white'('xtick.color'und'ytick.color') zu setzen. - Erstellen eines Boxplots mit dem
planets-Datensatz (df):- Zuordnung von
'distance'zurx-Achse und'method'zury-Achse. - Festlegen der Box-
widthauf0.6.
- Zuordnung von
- Erhöhen der Liniendicke mit
linewidth=2. - Deutliche Reduzierung der Farbsättigung durch Setzen von
saturationauf0.4.- Verwendung der
'vlag'-Palette.
- Verwendung der
- Anzeige der Grafik.
Lösung
Danke für Ihr Feedback!
single