Boxplot
Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, die Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.
Quartile
Quartile teilen sortierte Daten in vier gleiche Teile:
- Q1 — der Mittelpunkt zwischen dem Minimum und dem Median (25 % der Daten liegen darunter);
- Q2 — der Median (50 % der Daten liegen darunter);
- Q3 — der Mittelpunkt zwischen dem Median und dem Maximum (75 % der Daten liegen darunter).
Elemente eines Boxplots
- Die linke Seite der Box zeigt Q1, die rechte Seite zeigt Q3;
- IQR = Q3 − Q1, dargestellt als Breite der Box, mit dem Median durch eine gelbe Linie markiert;
- Whiskers erstrecken sich bis (Q1 - 1,5 \cdot IQR) und (Q3 + 1,5 \cdot IQR);
- Punkte außerhalb der Whiskers sind Ausreißer.
Ein Boxplot kann mit matplotlib erzeugt werden.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Boxplot-Daten
Verwendung von plt.boxplot(x), wobei x ein 1D-arrayähnliches Objekt, ein 2D-Array (eine Box pro Spalte) oder eine Sequenz von 1D-Arrays sein kann.
Optionale Parameter
tick_labels ist nützlich zur Benennung von Boxplots – insbesondere beim Plotten mehrerer Arrays.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Das Übergeben eines DataFrame mit zwei numerischen Spalten an boxplot() erzeugt zwei separate Boxplots mit automatisch zugewiesenen Beschriftungen.
Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die in der boxplot()-Dokumentation erkundet werden können, jedoch werden diese in der Praxis selten verwendet.
Swipe to start coding
Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:
- Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
- Verwenden Sie die Listen
normal_sample_1undnormal_sample_2(in dieser Reihenfolge von links nach rechts) als Daten. - Beschriften Sie den linken Boxplot mit
First sampleund den rechten mitSecond samplemithilfe derlist.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain how to interpret a box plot?
What does the IQR tell us about the data?
How do I identify outliers using a box plot?
Awesome!
Completion rate improved to 3.85
Boxplot
Swipe um das Menü anzuzeigen
Boxplot ist ein weiteres äußerst verbreitetes Diagramm in der Statistik, das verwendet wird, um die zentrale Tendenz, die Streuung und potenzielle Ausreißer innerhalb der Daten anhand ihrer Quartile zu visualisieren.
Quartile
Quartile teilen sortierte Daten in vier gleiche Teile:
- Q1 — der Mittelpunkt zwischen dem Minimum und dem Median (25 % der Daten liegen darunter);
- Q2 — der Median (50 % der Daten liegen darunter);
- Q3 — der Mittelpunkt zwischen dem Median und dem Maximum (75 % der Daten liegen darunter).
Elemente eines Boxplots
- Die linke Seite der Box zeigt Q1, die rechte Seite zeigt Q3;
- IQR = Q3 − Q1, dargestellt als Breite der Box, mit dem Median durch eine gelbe Linie markiert;
- Whiskers erstrecken sich bis (Q1 - 1,5 \cdot IQR) und (Q3 + 1,5 \cdot IQR);
- Punkte außerhalb der Whiskers sind Ausreißer.
Ein Boxplot kann mit matplotlib erzeugt werden.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Boxplot-Daten
Verwendung von plt.boxplot(x), wobei x ein 1D-arrayähnliches Objekt, ein 2D-Array (eine Box pro Spalte) oder eine Sequenz von 1D-Arrays sein kann.
Optionale Parameter
tick_labels ist nützlich zur Benennung von Boxplots – insbesondere beim Plotten mehrerer Arrays.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Das Übergeben eines DataFrame mit zwei numerischen Spalten an boxplot() erzeugt zwei separate Boxplots mit automatisch zugewiesenen Beschriftungen.
Es gibt auch eine Vielzahl optionaler Parameter zur Anpassung des Boxplots, die in der boxplot()-Dokumentation erkundet werden können, jedoch werden diese in der Praxis selten verwendet.
Swipe to start coding
Erstellen Sie zwei Boxplots mit zwei Stichproben aus der Standardnormalverteilung:
- Verwenden Sie die korrekte Funktion, um die Boxplots zu erstellen.
- Verwenden Sie die Listen
normal_sample_1undnormal_sample_2(in dieser Reihenfolge von links nach rechts) als Daten. - Beschriften Sie den linken Boxplot mit
First sampleund den rechten mitSecond samplemithilfe derlist.
Lösung
Danke für Ihr Feedback!
single