Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Boîte à Moustaches | Autres Graphiques Statistiques
Quizzes & Challenges
Quizzes
Challenges
/
Visualisation Ultime Avec Python

bookBoîte à Moustaches

Note
Définition

Box plot est un graphique extrêmement courant en statistique, utilisé pour visualiser la tendance centrale, la dispersion et les valeurs aberrantes potentielles des données via leurs quartiles.

Quartiles

quartiles

Quartiles divisent les données triées en quatre parties égales :

  • Q1 — le point médian entre la valeur minimale et la médiane (25 % des données en dessous) ;
  • Q2 — la médiane (50 % des données en dessous) ;
  • Q3 — le point médian entre la médiane et la valeur maximale (75 % des données en dessous).

Éléments du diagramme en boîte

box_plot_explained
  • Le côté gauche de la boîte représente Q1, le côté droit représente Q3 ;
  • IQR = Q3 − Q1, représenté par la largeur de la boîte, avec la médiane indiquée par une ligne jaune ;
  • Les moustaches s'étendent jusqu'à (Q1 - 1,5 \cdot IQR) et (Q3 + 1,5 \cdot IQR) ;
  • Les points situés en dehors des moustaches sont des valeurs aberrantes.

Un diagramme en boîte peut être généré à l'aide de matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Données du diagramme en boîte

Utiliser plt.boxplot(x), où x peut être un objet de type tableau 1D, un tableau 2D (une boîte par colonne), ou une séquence de tableaux 1D.

Paramètres optionnels

tick_labels permet de nommer les diagrammes en boîte — particulièrement utile lors de la représentation de plusieurs tableaux.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Transmettre un DataFrame avec deux colonnes numériques à boxplot() génère deux diagrammes en boîte distincts avec des étiquettes attribuées automatiquement.

Note
Approfondir

Il existe également de nombreux paramètres optionnels pour personnaliser le box plot, que vous pouvez explorer dans la documentation de boxplot(), mais en pratique, vous les utiliserez rarement.

Tâche

Swipe to start coding

Créer deux boîtes à moustaches à l'aide de deux échantillons issus de la distribution normale standard :

  1. Utiliser la fonction appropriée pour créer les boîtes à moustaches.
  2. Utiliser la liste normal_sample_1 et normal_sample_2 (dans cet ordre de gauche à droite) comme données.
  3. Étiqueter la boîte à moustaches de gauche comme First sample et celle de droite comme Second sample en utilisant la list.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 2
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain how to interpret a box plot?

What does the IQR tell us about the data?

How do I identify outliers using a box plot?

close

Awesome!

Completion rate improved to 3.85

bookBoîte à Moustaches

Glissez pour afficher le menu

Note
Définition

Box plot est un graphique extrêmement courant en statistique, utilisé pour visualiser la tendance centrale, la dispersion et les valeurs aberrantes potentielles des données via leurs quartiles.

Quartiles

quartiles

Quartiles divisent les données triées en quatre parties égales :

  • Q1 — le point médian entre la valeur minimale et la médiane (25 % des données en dessous) ;
  • Q2 — la médiane (50 % des données en dessous) ;
  • Q3 — le point médian entre la médiane et la valeur maximale (75 % des données en dessous).

Éléments du diagramme en boîte

box_plot_explained
  • Le côté gauche de la boîte représente Q1, le côté droit représente Q3 ;
  • IQR = Q3 − Q1, représenté par la largeur de la boîte, avec la médiane indiquée par une ligne jaune ;
  • Les moustaches s'étendent jusqu'à (Q1 - 1,5 \cdot IQR) et (Q3 + 1,5 \cdot IQR) ;
  • Les points situés en dehors des moustaches sont des valeurs aberrantes.

Un diagramme en boîte peut être généré à l'aide de matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Données du diagramme en boîte

Utiliser plt.boxplot(x), où x peut être un objet de type tableau 1D, un tableau 2D (une boîte par colonne), ou une séquence de tableaux 1D.

Paramètres optionnels

tick_labels permet de nommer les diagrammes en boîte — particulièrement utile lors de la représentation de plusieurs tableaux.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

Transmettre un DataFrame avec deux colonnes numériques à boxplot() génère deux diagrammes en boîte distincts avec des étiquettes attribuées automatiquement.

Note
Approfondir

Il existe également de nombreux paramètres optionnels pour personnaliser le box plot, que vous pouvez explorer dans la documentation de boxplot(), mais en pratique, vous les utiliserez rarement.

Tâche

Swipe to start coding

Créer deux boîtes à moustaches à l'aide de deux échantillons issus de la distribution normale standard :

  1. Utiliser la fonction appropriée pour créer les boîtes à moustaches.
  2. Utiliser la liste normal_sample_1 et normal_sample_2 (dans cet ordre de gauche à droite) comme données.
  3. Étiqueter la boîte à moustaches de gauche comme First sample et celle de droite comme Second sample en utilisant la list.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 2
single

single

some-alt