Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Résumé des données avec des boîtes à moustaches | Section
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Visualisation Statistique Avec Seaborn

bookRésumé des données avec des boîtes à moustaches

Un boxplot est une méthode standardisée pour afficher la distribution des données basée sur un résumé à cinq chiffres :

  1. Minimum (valeur la plus basse, hors valeurs aberrantes) ;
  2. Premier quartile (Q1) (25e centile) ;
  3. Médiane (50e centile) ;
  4. Troisième quartile (Q3) (75e centile) ;
  5. Maximum (valeur la plus élevée, hors valeurs aberrantes).

Pourquoi utiliser un boxplot ?

Il s'agit du meilleur outil pour comparer les distributions entre groupes. Il indique immédiatement :

  • Tendance centrale : où se situe la ligne de la médiane ? ;
  • Dispersion : quelle est la hauteur de la boîte ? (l'intervalle interquartile) ;
  • Symétrie : la médiane est-elle au centre de la boîte ? ;
  • Valeurs aberrantes : y a-t-il des points en dehors des moustaches ?

Paramètres clés

  • saturation : contrôle l'intensité des couleurs (de 0 à 1). Des valeurs plus faibles rendent les couleurs plus atténuées ;
  • linewidth : contrôle l'épaisseur des contours de la boîte et des moustaches ;
  • width : contrôle la largeur de la boîte elle-même.

Exemple

Voici un boxplot analysant le jeu de données "Tips". Remarquez comment les points représentant les valeurs aberrantes apparaissent au-dessus des moustaches.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation de la distance des planètes découvertes par différentes méthodes.

  1. Définir le style sur 'ticks'. Personnaliser le thème en passant un dictionnaire pour modifier l'arrière-plan en 'grey' ('figure.facecolor') et la couleur des graduations en 'white' ('xtick.color' et 'ytick.color').
  2. Créer un boxplot à l'aide du jeu de données planets (df) :
  • Associer 'distance' à l'axe x et 'method' à l'axe y.
  • Définir la width de la boîte à 0.6.
  • Épaissir les lignes avec linewidth=2.
  • Atténuer fortement les couleurs en réglant saturation à 0.4.
  • Utiliser la palette 'vlag'.
  1. Afficher le graphique.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 11
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookRésumé des données avec des boîtes à moustaches

Glissez pour afficher le menu

Un boxplot est une méthode standardisée pour afficher la distribution des données basée sur un résumé à cinq chiffres :

  1. Minimum (valeur la plus basse, hors valeurs aberrantes) ;
  2. Premier quartile (Q1) (25e centile) ;
  3. Médiane (50e centile) ;
  4. Troisième quartile (Q3) (75e centile) ;
  5. Maximum (valeur la plus élevée, hors valeurs aberrantes).

Pourquoi utiliser un boxplot ?

Il s'agit du meilleur outil pour comparer les distributions entre groupes. Il indique immédiatement :

  • Tendance centrale : où se situe la ligne de la médiane ? ;
  • Dispersion : quelle est la hauteur de la boîte ? (l'intervalle interquartile) ;
  • Symétrie : la médiane est-elle au centre de la boîte ? ;
  • Valeurs aberrantes : y a-t-il des points en dehors des moustaches ?

Paramètres clés

  • saturation : contrôle l'intensité des couleurs (de 0 à 1). Des valeurs plus faibles rendent les couleurs plus atténuées ;
  • linewidth : contrôle l'épaisseur des contours de la boîte et des moustaches ;
  • width : contrôle la largeur de la boîte elle-même.

Exemple

Voici un boxplot analysant le jeu de données "Tips". Remarquez comment les points représentant les valeurs aberrantes apparaissent au-dessus des moustaches.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation de la distance des planètes découvertes par différentes méthodes.

  1. Définir le style sur 'ticks'. Personnaliser le thème en passant un dictionnaire pour modifier l'arrière-plan en 'grey' ('figure.facecolor') et la couleur des graduations en 'white' ('xtick.color' et 'ytick.color').
  2. Créer un boxplot à l'aide du jeu de données planets (df) :
  • Associer 'distance' à l'axe x et 'method' à l'axe y.
  • Définir la width de la boîte à 0.6.
  • Épaissir les lignes avec linewidth=2.
  • Atténuer fortement les couleurs en réglant saturation à 0.4.
  • Utiliser la palette 'vlag'.
  1. Afficher le graphique.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 11
single

single

some-alt