Visualisierung Kategorialer Streudiagramme
In der Statistik ist eine kategorische Variable eine Variable, die nur eine begrenzte Anzahl möglicher Werte annehmen kann (z. B. "Wochentag", "Geschlecht", "Land").
Ein stripplot ist im Wesentlichen ein Streudiagramm, bei dem eine der Achsen eine kategoriale Variable darstellt. Es visualisiert die Verteilung vieler einzelner eindimensionaler Werte.
Warum einen Stripplot verwenden?
Im Gegensatz zu einem Histogramm oder Dichtediagramm, die Daten aggregieren, zeigt ein Stripplot jede einzelne Beobachtung als Punkt. Dies ist ideal für kleinere Datensätze, bei denen die genaue Verteilung und Ausreißer sichtbar sein sollen.
Wichtige Parameter zur Anpassung
Da sich Punkte überlappen können (ein Problem, das als "Overplotting" bezeichnet wird), bietet stripplot verschiedene Möglichkeiten, sie unterscheidbar zu machen:
alpha: steuert die Transparenz (0 bis 1). Ein niedriger Wert (z. B.0.25) hilft, die Dichte zu visualisieren — dunklere Bereiche bedeuten mehr Punkte;size: ändert den Radius der Punkte;marker: ändert die Form der Punkte (z. B.'D'für Diamanten,'s'für Quadrate);jitter: fügt eine kleine Menge zufälliges Rauschen zur Position der Punkte hinzu, sodass sie nicht exakt übereinander liegen (standardmäßig aktiviert).
Live-Beispiel
Hier wird gezeigt, wie ein Stripplot erstellt wird, der Transparenz verwendet, um überlappende Daten darzustellen.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualisierung der Verteilung der Rechnungsbeträge pro Tag mit einem angepassten Stil.
- Einstellung des Stils auf
'whitegrid'. Übergabe eines Dictionaries, um die Hintergrundfarbe ('axes.facecolor') auf'aliceblue'zu setzen. - Erstellung eines Stripplots mit dem
tips-Datensatz (df):- Zuordnung von
'day'zurx-Achse und'total_bill'zury-Achse. - Farbige Darstellung der Punkte basierend auf dem
'smoker'-Status mittelshue.
- Zuordnung von
- Festlegung der Punktgröße (
size) auf20.- Verwendung der
'crest'-Palette.
- Verwendung der
- Änderung der Markersymbole zu Rauten mit
marker='D'. - Einstellung der Transparenz (
alpha) auf0.25.
- Anzeige der Grafik.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 4.55
Visualisierung Kategorialer Streudiagramme
Swipe um das Menü anzuzeigen
In der Statistik ist eine kategorische Variable eine Variable, die nur eine begrenzte Anzahl möglicher Werte annehmen kann (z. B. "Wochentag", "Geschlecht", "Land").
Ein stripplot ist im Wesentlichen ein Streudiagramm, bei dem eine der Achsen eine kategoriale Variable darstellt. Es visualisiert die Verteilung vieler einzelner eindimensionaler Werte.
Warum einen Stripplot verwenden?
Im Gegensatz zu einem Histogramm oder Dichtediagramm, die Daten aggregieren, zeigt ein Stripplot jede einzelne Beobachtung als Punkt. Dies ist ideal für kleinere Datensätze, bei denen die genaue Verteilung und Ausreißer sichtbar sein sollen.
Wichtige Parameter zur Anpassung
Da sich Punkte überlappen können (ein Problem, das als "Overplotting" bezeichnet wird), bietet stripplot verschiedene Möglichkeiten, sie unterscheidbar zu machen:
alpha: steuert die Transparenz (0 bis 1). Ein niedriger Wert (z. B.0.25) hilft, die Dichte zu visualisieren — dunklere Bereiche bedeuten mehr Punkte;size: ändert den Radius der Punkte;marker: ändert die Form der Punkte (z. B.'D'für Diamanten,'s'für Quadrate);jitter: fügt eine kleine Menge zufälliges Rauschen zur Position der Punkte hinzu, sodass sie nicht exakt übereinander liegen (standardmäßig aktiviert).
Live-Beispiel
Hier wird gezeigt, wie ein Stripplot erstellt wird, der Transparenz verwendet, um überlappende Daten darzustellen.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualisierung der Verteilung der Rechnungsbeträge pro Tag mit einem angepassten Stil.
- Einstellung des Stils auf
'whitegrid'. Übergabe eines Dictionaries, um die Hintergrundfarbe ('axes.facecolor') auf'aliceblue'zu setzen. - Erstellung eines Stripplots mit dem
tips-Datensatz (df):- Zuordnung von
'day'zurx-Achse und'total_bill'zury-Achse. - Farbige Darstellung der Punkte basierend auf dem
'smoker'-Status mittelshue.
- Zuordnung von
- Festlegung der Punktgröße (
size) auf20.- Verwendung der
'crest'-Palette.
- Verwendung der
- Änderung der Markersymbole zu Rauten mit
marker='D'. - Einstellung der Transparenz (
alpha) auf0.25.
- Anzeige der Grafik.
Lösung
Danke für Ihr Feedback!
single