Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Datenanalyse mit Boxplots | Abschnitt
Practice
Projects
Quizzes & Challenges
Quizze
Challenges
/
Datenvisualisierung mit Matplotlib

bookDatenanalyse mit Boxplots

Note
Definition

Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile

Quartile teilen sortierte Daten in vier gleich große Teile:

  • Q1 — der Mittelpunkt zwischen dem Minimum und dem Median (25 % der Daten liegen darunter);
  • Q2 — der Median (50 % der Daten liegen darunter);
  • Q3 — der Mittelpunkt zwischen dem Median und dem Maximum (75 % der Daten liegen darunter).

Elemente eines Boxplots

box_plot_explained
  • Die linke Seite der Box zeigt Q1, die rechte Seite zeigt Q3;
  • IQR = Q3 − Q1, dargestellt als die Breite der Box, mit dem Median durch eine gelbe Linie markiert;
  • Whisker erstrecken sich bis (Q1 - 1,5 \cdot IQR) und (Q3 + 1,5 \cdot IQR);
  • Punkte außerhalb der Whisker sind Ausreißer.

Ein Boxplot kann mit matplotlib erstellt werden.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Verwenden Sie plt.boxplot(x), wobei x ein 1D-arrayähnliches Objekt, ein 2D-Array (eine Box pro Spalte) oder eine Sequenz von 1D-Arrays sein kann.

Optionale Parameter

tick_labels ist nützlich zur Benennung von Boxplots – insbesondere beim Plotten mehrerer Arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Das Übergeben eines DataFrame mit zwei numerischen Spalten an boxplot() erzeugt zwei separate Boxplots mit automatisch zugewiesenen Beschriftungen.

Note
Mehr erfahren

Es gibt auch zahlreiche optionale Parameter zur Anpassung des Boxplots, die Sie in der boxplot() Dokumentation nachlesen können, die Sie in der Praxis jedoch selten benötigen.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Daten.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 16
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookDatenanalyse mit Boxplots

Swipe um das Menü anzuzeigen

Note
Definition

Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile

Quartile teilen sortierte Daten in vier gleich große Teile:

  • Q1 — der Mittelpunkt zwischen dem Minimum und dem Median (25 % der Daten liegen darunter);
  • Q2 — der Median (50 % der Daten liegen darunter);
  • Q3 — der Mittelpunkt zwischen dem Median und dem Maximum (75 % der Daten liegen darunter).

Elemente eines Boxplots

box_plot_explained
  • Die linke Seite der Box zeigt Q1, die rechte Seite zeigt Q3;
  • IQR = Q3 − Q1, dargestellt als die Breite der Box, mit dem Median durch eine gelbe Linie markiert;
  • Whisker erstrecken sich bis (Q1 - 1,5 \cdot IQR) und (Q3 + 1,5 \cdot IQR);
  • Punkte außerhalb der Whisker sind Ausreißer.

Ein Boxplot kann mit matplotlib erstellt werden.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Verwenden Sie plt.boxplot(x), wobei x ein 1D-arrayähnliches Objekt, ein 2D-Array (eine Box pro Spalte) oder eine Sequenz von 1D-Arrays sein kann.

Optionale Parameter

tick_labels ist nützlich zur Benennung von Boxplots – insbesondere beim Plotten mehrerer Arrays.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Das Übergeben eines DataFrame mit zwei numerischen Spalten an boxplot() erzeugt zwei separate Boxplots mit automatisch zugewiesenen Beschriftungen.

Note
Mehr erfahren

Es gibt auch zahlreiche optionale Parameter zur Anpassung des Boxplots, die Sie in der boxplot() Dokumentation nachlesen können, die Sie in der Praxis jedoch selten benötigen.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Daten.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 16
single

single

some-alt