Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Boxplot | Weitere Statistische Diagramme
Quizzes & Challenges
Quizzes
Challenges
/
Ultimative Visualisierung mit Python

bookBoxplot

Note
Definition

Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, die Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile

Quartile teilen sortierte Daten in vier gleiche Teile:

  • Q1 — der Mittelpunkt zwischen dem Minimum und dem Median (25 % der Daten liegen darunter);
  • Q2 — der Median (50 % der Daten liegen darunter);
  • Q3 — der Mittelpunkt zwischen dem Median und dem Maximum (75 % der Daten liegen darunter).

Elemente eines Boxplots

box_plot_explained
  • Die linke Seite der Box zeigt Q1, die rechte Seite zeigt Q3;
  • IQR = Q3 − Q1, dargestellt als Breite der Box, mit dem Median durch eine gelbe Linie markiert;
  • Whiskers erstrecken sich bis (Q1 - 1,5 \cdot IQR) und (Q3 + 1,5 \cdot IQR);
  • Punkte außerhalb der Whiskers sind Ausreißer.

Ein Boxplot kann mit matplotlib erzeugt werden.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Verwendung von plt.boxplot(x), wobei x ein 1D-arrayähnliches Objekt, ein 2D-Array (eine Box pro Spalte) oder eine Sequenz von 1D-Arrays sein kann.

Optionale Parameter

tick_labels ist nützlich zur Benennung von Boxplots – insbesondere beim Plotten mehrerer Arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Das Übergeben eines DataFrame mit zwei numerischen Spalten an boxplot() erzeugt zwei separate Boxplots mit automatisch zugewiesenen Beschriftungen.

Note
Weiterführende Informationen

Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die in der boxplot()-Dokumentation erkundet werden können, jedoch werden diese in der Praxis selten verwendet.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Daten.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 2
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain how to interpret a box plot?

What does the IQR tell us about the data?

How do I identify outliers using a box plot?

close

Awesome!

Completion rate improved to 3.85

bookBoxplot

Swipe um das Menü anzuzeigen

Note
Definition

Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, die Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile

Quartile teilen sortierte Daten in vier gleiche Teile:

  • Q1 — der Mittelpunkt zwischen dem Minimum und dem Median (25 % der Daten liegen darunter);
  • Q2 — der Median (50 % der Daten liegen darunter);
  • Q3 — der Mittelpunkt zwischen dem Median und dem Maximum (75 % der Daten liegen darunter).

Elemente eines Boxplots

box_plot_explained
  • Die linke Seite der Box zeigt Q1, die rechte Seite zeigt Q3;
  • IQR = Q3 − Q1, dargestellt als Breite der Box, mit dem Median durch eine gelbe Linie markiert;
  • Whiskers erstrecken sich bis (Q1 - 1,5 \cdot IQR) und (Q3 + 1,5 \cdot IQR);
  • Punkte außerhalb der Whiskers sind Ausreißer.

Ein Boxplot kann mit matplotlib erzeugt werden.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Verwendung von plt.boxplot(x), wobei x ein 1D-arrayähnliches Objekt, ein 2D-Array (eine Box pro Spalte) oder eine Sequenz von 1D-Arrays sein kann.

Optionale Parameter

tick_labels ist nützlich zur Benennung von Boxplots – insbesondere beim Plotten mehrerer Arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Das Übergeben eines DataFrame mit zwei numerischen Spalten an boxplot() erzeugt zwei separate Boxplots mit automatisch zugewiesenen Beschriftungen.

Note
Weiterführende Informationen

Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die in der boxplot()-Dokumentation erkundet werden können, jedoch werden diese in der Praxis selten verwendet.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Daten.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 2
single

single

some-alt