Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Visualisierung Kategorialer Streudiagramme | Abschnitt
Statistische Visualisierung mit Seaborn

bookVisualisierung Kategorialer Streudiagramme

In der Statistik ist eine kategorische Variable eine Variable, die nur eine begrenzte Anzahl möglicher Werte annehmen kann (z. B. "Wochentag", "Geschlecht", "Land").

Ein stripplot ist im Wesentlichen ein Streudiagramm, bei dem eine der Achsen eine kategoriale Variable darstellt. Es visualisiert die Verteilung vieler einzelner eindimensionaler Werte.

Warum einen Stripplot verwenden?

Im Gegensatz zu einem Histogramm oder Dichtediagramm, die Daten aggregieren, zeigt ein Stripplot jede einzelne Beobachtung als Punkt. Dies ist ideal für kleinere Datensätze, bei denen die genaue Verteilung und Ausreißer sichtbar sein sollen.

Wichtige Parameter zur Anpassung

Da sich Punkte überlappen können (ein Problem, das als "Overplotting" bezeichnet wird), bietet stripplot verschiedene Möglichkeiten, sie unterscheidbar zu machen:

  • alpha: steuert die Transparenz (0 bis 1). Ein niedriger Wert (z. B. 0.25) hilft, die Dichte zu visualisieren — dunklere Bereiche bedeuten mehr Punkte;
  • size: ändert den Radius der Punkte;
  • marker: ändert die Form der Punkte (z. B. 'D' für Diamanten, 's' für Quadrate);
  • jitter: fügt eine kleine Menge zufälliges Rauschen zur Position der Punkte hinzu, sodass sie nicht exakt übereinander liegen (standardmäßig aktiviert).

Live-Beispiel

Hier wird gezeigt, wie ein Stripplot erstellt wird, der Transparenz verwendet, um überlappende Daten darzustellen.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Aufgabe

Swipe to start coding

Visualisierung der Verteilung der Rechnungsbeträge pro Tag mit einem angepassten Stil.

  1. Einstellung des Stils auf 'whitegrid'. Übergabe eines Dictionaries, um die Hintergrundfarbe ('axes.facecolor') auf 'aliceblue' zu setzen.
  2. Erstellung eines Stripplots mit dem tips-Datensatz (df):
    • Zuordnung von 'day' zur x-Achse und 'total_bill' zur y-Achse.
    • Farbige Darstellung der Punkte basierend auf dem 'smoker'-Status mittels hue.
  • Festlegung der Punktgröße (size) auf 20.
    • Verwendung der 'crest'-Palette.
  • Änderung der Markersymbole zu Rauten mit marker='D'.
  • Einstellung der Transparenz (alpha) auf 0.25.
  1. Anzeige der Grafik.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 9
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookVisualisierung Kategorialer Streudiagramme

Swipe um das Menü anzuzeigen

In der Statistik ist eine kategorische Variable eine Variable, die nur eine begrenzte Anzahl möglicher Werte annehmen kann (z. B. "Wochentag", "Geschlecht", "Land").

Ein stripplot ist im Wesentlichen ein Streudiagramm, bei dem eine der Achsen eine kategoriale Variable darstellt. Es visualisiert die Verteilung vieler einzelner eindimensionaler Werte.

Warum einen Stripplot verwenden?

Im Gegensatz zu einem Histogramm oder Dichtediagramm, die Daten aggregieren, zeigt ein Stripplot jede einzelne Beobachtung als Punkt. Dies ist ideal für kleinere Datensätze, bei denen die genaue Verteilung und Ausreißer sichtbar sein sollen.

Wichtige Parameter zur Anpassung

Da sich Punkte überlappen können (ein Problem, das als "Overplotting" bezeichnet wird), bietet stripplot verschiedene Möglichkeiten, sie unterscheidbar zu machen:

  • alpha: steuert die Transparenz (0 bis 1). Ein niedriger Wert (z. B. 0.25) hilft, die Dichte zu visualisieren — dunklere Bereiche bedeuten mehr Punkte;
  • size: ändert den Radius der Punkte;
  • marker: ändert die Form der Punkte (z. B. 'D' für Diamanten, 's' für Quadrate);
  • jitter: fügt eine kleine Menge zufälliges Rauschen zur Position der Punkte hinzu, sodass sie nicht exakt übereinander liegen (standardmäßig aktiviert).

Live-Beispiel

Hier wird gezeigt, wie ein Stripplot erstellt wird, der Transparenz verwendet, um überlappende Daten darzustellen.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Aufgabe

Swipe to start coding

Visualisierung der Verteilung der Rechnungsbeträge pro Tag mit einem angepassten Stil.

  1. Einstellung des Stils auf 'whitegrid'. Übergabe eines Dictionaries, um die Hintergrundfarbe ('axes.facecolor') auf 'aliceblue' zu setzen.
  2. Erstellung eines Stripplots mit dem tips-Datensatz (df):
    • Zuordnung von 'day' zur x-Achse und 'total_bill' zur y-Achse.
    • Farbige Darstellung der Punkte basierend auf dem 'smoker'-Status mittels hue.
  • Festlegung der Punktgröße (size) auf 20.
    • Verwendung der 'crest'-Palette.
  • Änderung der Markersymbole zu Rauten mit marker='D'.
  • Einstellung der Transparenz (alpha) auf 0.25.
  1. Anzeige der Grafik.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 9
single

single

some-alt