Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Analyse des Données avec des Boîtes à Moustaches | Section
Visualisation de Données avec Matplotlib

bookAnalyse des Données avec des Boîtes à Moustaches

Note
Définition

Diagramme en boîte est un autre graphique extrêmement courant en statistique, utilisé pour visualiser la tendance centrale, la dispersion et les valeurs aberrantes potentielles des données via leurs quartiles.

Quartiles

quartiles

Quartiles divisent les données triées en quatre parties égales :

  • Q1 — le point médian entre la valeur minimale et la médiane (25 % des données en dessous) ;
  • Q2 — la médiane (50 % des données en dessous) ;
  • Q3 — le point médian entre la médiane et la valeur maximale (75 % des données en dessous).

Éléments du diagramme en boîte

box_plot_explained
  • Le côté gauche de la boîte représente Q1, le côté droit représente Q3 ;
  • IQR = Q3 − Q1, représenté par la largeur de la boîte, avec la médiane indiquée par une ligne jaune ;
  • Les moustaches s'étendent jusqu'à (Q1 - 1,5 \cdot IQR) et (Q3 + 1,5 \cdot IQR) ;
  • Les points en dehors des moustaches sont des valeurs aberrantes.

Un diagramme en boîte peut être généré à l'aide de matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Données du diagramme en boîte

Utiliser plt.boxplot(x), où x peut être un objet de type tableau 1D, un tableau 2D (une boîte par colonne), ou une séquence de tableaux 1D.

Paramètres optionnels

tick_labels est utile pour nommer les diagrammes en boîte — particulièrement lors de la représentation de plusieurs tableaux.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

La transmission d'un DataFrame avec deux colonnes numériques à boxplot() génère deux diagrammes en boîte distincts avec des étiquettes attribuées automatiquement.

Note
Approfondir

Il existe également de nombreux paramètres optionnels pour personnaliser le box plot, que vous pouvez explorer dans la documentation de boxplot(), mais en pratique, il est rare de les utiliser.

Tâche

Swipe to start coding

Créer deux boîtes à moustaches en utilisant deux échantillons issus de la distribution normale standard :

  1. Utiliser la fonction appropriée pour créer les boîtes à moustaches.
  2. Utiliser la liste de normal_sample_1 et normal_sample_2 (dans cet ordre de gauche à droite) comme données.
  3. Étiqueter la boîte à moustaches de gauche comme First sample et celle de droite comme Second sample en utilisant la list.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 16
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookAnalyse des Données avec des Boîtes à Moustaches

Glissez pour afficher le menu

Note
Définition

Diagramme en boîte est un autre graphique extrêmement courant en statistique, utilisé pour visualiser la tendance centrale, la dispersion et les valeurs aberrantes potentielles des données via leurs quartiles.

Quartiles

quartiles

Quartiles divisent les données triées en quatre parties égales :

  • Q1 — le point médian entre la valeur minimale et la médiane (25 % des données en dessous) ;
  • Q2 — la médiane (50 % des données en dessous) ;
  • Q3 — le point médian entre la médiane et la valeur maximale (75 % des données en dessous).

Éléments du diagramme en boîte

box_plot_explained
  • Le côté gauche de la boîte représente Q1, le côté droit représente Q3 ;
  • IQR = Q3 − Q1, représenté par la largeur de la boîte, avec la médiane indiquée par une ligne jaune ;
  • Les moustaches s'étendent jusqu'à (Q1 - 1,5 \cdot IQR) et (Q3 + 1,5 \cdot IQR) ;
  • Les points en dehors des moustaches sont des valeurs aberrantes.

Un diagramme en boîte peut être généré à l'aide de matplotlib.

1234567891011
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a box plot for the Seattle temperatures plt.boxplot(weather_df['Seattle']) plt.show()
copy

Données du diagramme en boîte

Utiliser plt.boxplot(x), où x peut être un objet de type tableau 1D, un tableau 2D (une boîte par colonne), ou une séquence de tableaux 1D.

Paramètres optionnels

tick_labels est utile pour nommer les diagrammes en boîte — particulièrement lors de la représentation de plusieurs tableaux.

12345678910
import pandas as pd import matplotlib.pyplot as plt # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating two box plots for Boston and Seattle temperatures plt.boxplot(weather_df, tick_labels=['Boston', 'Seattle']) plt.show()
copy

La transmission d'un DataFrame avec deux colonnes numériques à boxplot() génère deux diagrammes en boîte distincts avec des étiquettes attribuées automatiquement.

Note
Approfondir

Il existe également de nombreux paramètres optionnels pour personnaliser le box plot, que vous pouvez explorer dans la documentation de boxplot(), mais en pratique, il est rare de les utiliser.

Tâche

Swipe to start coding

Créer deux boîtes à moustaches en utilisant deux échantillons issus de la distribution normale standard :

  1. Utiliser la fonction appropriée pour créer les boîtes à moustaches.
  2. Utiliser la liste de normal_sample_1 et normal_sample_2 (dans cet ordre de gauche à droite) comme données.
  3. Étiqueter la boîte à moustaches de gauche comme First sample et celle de droite comme Second sample en utilisant la list.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 16
single

single

some-alt