Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Boxplot | Weitere Statistische Diagramme
Ultimative Visualisierung mit Python

bookBoxplot

Note
Definition

Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile

Quartile teilen die Datenpunkte (aufsteigend sortiert) in vier gleich große Teile. Es gibt drei davon:

  • Das erste Quartil (Q1) ist die mittlere Zahl zwischen dem kleinsten Wert (Zahl) der Stichprobe und dem Median (25% der Daten liegen in diesem Bereich);
  • Das zweite Quartil (Q2) ist der Median selbst (50% der Daten liegen unterhalb des Medians);
  • Das dritte Quartil (Q3) ist die mittlere Zahl zwischen dem Median der Stichprobe und den höchsten Werten der Stichprobe (75% der Daten liegen unterhalb von Q3).

Elemente des Boxplots

box_plot_explained
  • Die rechte Seite des roten Rechtecks stellt das dritte Quartil dar und die linke Seite das erste Quartil;
  • Q3 - Q1 wird als Interquartilsabstand (IQR) bezeichnet, der durch das Rechteck dargestellt wird, wobei die gelbe Linie den Median markiert;
  • Die schwarzen Linien außerhalb des Rechtecks werden als Whisker bezeichnet. Die linke Linie stellt Q11,5IR\text{Q1} - 1{,}5 \cdot \text{IR} dar, die rechte Linie Q3+1,5IR\text{Q3} + 1{,}5 \cdot \text{IR};
  • Die Datenpunkte außerhalb der Whisker werden als Ausreißer bezeichnet.

Im nächsten Schritt wird ein Boxplot mit der Bibliothek matplotlib erzeugt:

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Die Funktion boxplot() aus dem Modul pyplot wird mit dem ersten und einzigen erforderlichen Parameter x verwendet, der die Daten repräsentiert. Diese Daten können ein array-ähnliches Objekt (z. B. eine Series), ein 2D-Array (für jede Spalte wird ein Boxplot gezeichnet) oder eine Sequenz von 1D-Arrays sein (für jedes Array wird ein Boxplot gezeichnet).

Optionale Parameter

Der Parameter tick_labels stellt eine Ausnahme dar. Dieser ist besonders nützlich, um nicht nur ein einzelnes Boxplot zu beschriften, sondern auch die Boxplots zu beschriften, wenn mehr als ein Array vorhanden ist:

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

In diesem Beispiel wurde das gesamte DataFrame mit zwei Spalten an boxplot() übergeben, wodurch separate Boxplots für jede Spalte mit automatisch zugewiesenen, passenden Beschriftungen erstellt werden.

Note
Weiterführende Informationen

Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die in der boxplot()-Dokumentation erkundet werden können. In der Praxis werden diese jedoch selten verwendet.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Daten.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 2
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain what the interquartile range (IQR) is used for?

How do I interpret outliers in a box plot?

Can you show how to customize the appearance of a box plot?

close

Awesome!

Completion rate improved to 3.85

bookBoxplot

Swipe um das Menü anzuzeigen

Note
Definition

Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.

Quartile

Quartile

Quartile teilen die Datenpunkte (aufsteigend sortiert) in vier gleich große Teile. Es gibt drei davon:

  • Das erste Quartil (Q1) ist die mittlere Zahl zwischen dem kleinsten Wert (Zahl) der Stichprobe und dem Median (25% der Daten liegen in diesem Bereich);
  • Das zweite Quartil (Q2) ist der Median selbst (50% der Daten liegen unterhalb des Medians);
  • Das dritte Quartil (Q3) ist die mittlere Zahl zwischen dem Median der Stichprobe und den höchsten Werten der Stichprobe (75% der Daten liegen unterhalb von Q3).

Elemente des Boxplots

box_plot_explained
  • Die rechte Seite des roten Rechtecks stellt das dritte Quartil dar und die linke Seite das erste Quartil;
  • Q3 - Q1 wird als Interquartilsabstand (IQR) bezeichnet, der durch das Rechteck dargestellt wird, wobei die gelbe Linie den Median markiert;
  • Die schwarzen Linien außerhalb des Rechtecks werden als Whisker bezeichnet. Die linke Linie stellt Q11,5IR\text{Q1} - 1{,}5 \cdot \text{IR} dar, die rechte Linie Q3+1,5IR\text{Q3} + 1{,}5 \cdot \text{IR};
  • Die Datenpunkte außerhalb der Whisker werden als Ausreißer bezeichnet.

Im nächsten Schritt wird ein Boxplot mit der Bibliothek matplotlib erzeugt:

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Boxplot-Daten

Die Funktion boxplot() aus dem Modul pyplot wird mit dem ersten und einzigen erforderlichen Parameter x verwendet, der die Daten repräsentiert. Diese Daten können ein array-ähnliches Objekt (z. B. eine Series), ein 2D-Array (für jede Spalte wird ein Boxplot gezeichnet) oder eine Sequenz von 1D-Arrays sein (für jedes Array wird ein Boxplot gezeichnet).

Optionale Parameter

Der Parameter tick_labels stellt eine Ausnahme dar. Dieser ist besonders nützlich, um nicht nur ein einzelnes Boxplot zu beschriften, sondern auch die Boxplots zu beschriften, wenn mehr als ein Array vorhanden ist:

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

In diesem Beispiel wurde das gesamte DataFrame mit zwei Spalten an boxplot() übergeben, wodurch separate Boxplots für jede Spalte mit automatisch zugewiesenen, passenden Beschriftungen erstellt werden.

Note
Weiterführende Informationen

Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die in der boxplot()-Dokumentation erkundet werden können. In der Praxis werden diese jedoch selten verwendet.

Aufgabe

Swipe to start coding

Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:

  1. Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
  2. Verwenden Sie die Listen normal_sample_1 und normal_sample_2 (in dieser Reihenfolge von links nach rechts) als Daten.
  3. Beschriften Sie den linken Boxplot mit First sample und den rechten mit Second sample mithilfe der list.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 2
single

single

some-alt