Boîte à Moustaches
Box plot est un graphique extrêmement courant en statistique, utilisé pour visualiser la tendance centrale, la dispersion et les valeurs aberrantes potentielles des données via leurs quartiles.
Quartiles
Quartiles divisent les données triées en quatre parties égales :
- Q1 — le point médian entre la valeur minimale et la médiane (25 % des données en dessous) ;
- Q2 — la médiane (50 % des données en dessous) ;
- Q3 — le point médian entre la médiane et la valeur maximale (75 % des données en dessous).
Éléments du diagramme en boîte
- Le côté gauche de la boîte représente Q1, le côté droit représente Q3 ;
- IQR = Q3 − Q1, représenté par la largeur de la boîte, avec la médiane indiquée par une ligne jaune ;
- Les moustaches s'étendent jusqu'à (Q1 - 1,5 \cdot IQR) et (Q3 + 1,5 \cdot IQR) ;
- Les points situés en dehors des moustaches sont des valeurs aberrantes.
Un diagramme en boîte peut être généré à l'aide de matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Données du diagramme en boîte
Utiliser plt.boxplot(x), où x peut être un objet de type tableau 1D, un tableau 2D (une boîte par colonne), ou une séquence de tableaux 1D.
Paramètres optionnels
tick_labels permet de nommer les diagrammes en boîte — particulièrement utile lors de la représentation de plusieurs tableaux.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Transmettre un DataFrame avec deux colonnes numériques à boxplot() génère deux diagrammes en boîte distincts avec des étiquettes attribuées automatiquement.
Il existe également de nombreux paramètres optionnels pour personnaliser le box plot, que vous pouvez explorer dans la documentation de boxplot(), mais en pratique, vous les utiliserez rarement.
Swipe to start coding
Créer deux boîtes à moustaches à l'aide de deux échantillons issus de la distribution normale standard :
- Utiliser la fonction appropriée pour créer les boîtes à moustaches.
- Utiliser la liste
normal_sample_1etnormal_sample_2(dans cet ordre de gauche à droite) comme données. - Étiqueter la boîte à moustaches de gauche comme
First sampleet celle de droite commeSecond sampleen utilisant lalist.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain how to interpret a box plot?
What does the IQR tell us about the data?
How do I identify outliers using a box plot?
Awesome!
Completion rate improved to 3.85
Boîte à Moustaches
Glissez pour afficher le menu
Box plot est un graphique extrêmement courant en statistique, utilisé pour visualiser la tendance centrale, la dispersion et les valeurs aberrantes potentielles des données via leurs quartiles.
Quartiles
Quartiles divisent les données triées en quatre parties égales :
- Q1 — le point médian entre la valeur minimale et la médiane (25 % des données en dessous) ;
- Q2 — la médiane (50 % des données en dessous) ;
- Q3 — le point médian entre la médiane et la valeur maximale (75 % des données en dessous).
Éléments du diagramme en boîte
- Le côté gauche de la boîte représente Q1, le côté droit représente Q3 ;
- IQR = Q3 − Q1, représenté par la largeur de la boîte, avec la médiane indiquée par une ligne jaune ;
- Les moustaches s'étendent jusqu'à (Q1 - 1,5 \cdot IQR) et (Q3 + 1,5 \cdot IQR) ;
- Les points situés en dehors des moustaches sont des valeurs aberrantes.
Un diagramme en boîte peut être généré à l'aide de matplotlib.
1234567891011import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
Données du diagramme en boîte
Utiliser plt.boxplot(x), où x peut être un objet de type tableau 1D, un tableau 2D (une boîte par colonne), ou une séquence de tableaux 1D.
Paramètres optionnels
tick_labels permet de nommer les diagrammes en boîte — particulièrement utile lors de la représentation de plusieurs tableaux.
12345678910import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
Transmettre un DataFrame avec deux colonnes numériques à boxplot() génère deux diagrammes en boîte distincts avec des étiquettes attribuées automatiquement.
Il existe également de nombreux paramètres optionnels pour personnaliser le box plot, que vous pouvez explorer dans la documentation de boxplot(), mais en pratique, vous les utiliserez rarement.
Swipe to start coding
Créer deux boîtes à moustaches à l'aide de deux échantillons issus de la distribution normale standard :
- Utiliser la fonction appropriée pour créer les boîtes à moustaches.
- Utiliser la liste
normal_sample_1etnormal_sample_2(dans cet ordre de gauche à droite) comme données. - Étiqueter la boîte à moustaches de gauche comme
First sampleet celle de droite commeSecond sampleen utilisant lalist.
Solution
Merci pour vos commentaires !
single