Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Résumé des données avec des boîtes à moustaches | Section
Visualisation Statistique Avec Seaborn
Section 1. Chapitre 11
single

single

bookRésumé des données avec des boîtes à moustaches

Glissez pour afficher le menu

Un boxplot est une méthode standardisée pour afficher la distribution des données basée sur un résumé à cinq chiffres :

  1. Minimum (valeur la plus basse, hors valeurs aberrantes) ;
  2. Premier quartile (Q1) (25e centile) ;
  3. Médiane (50e centile) ;
  4. Troisième quartile (Q3) (75e centile) ;
  5. Maximum (valeur la plus élevée, hors valeurs aberrantes).

Pourquoi utiliser un boxplot ?

Il s'agit du meilleur outil pour comparer les distributions entre groupes. Il indique immédiatement :

  • Tendance centrale : où se situe la ligne de la médiane ? ;
  • Dispersion : quelle est la hauteur de la boîte ? (l'intervalle interquartile) ;
  • Symétrie : la médiane est-elle au centre de la boîte ? ;
  • Valeurs aberrantes : y a-t-il des points en dehors des moustaches ?

Paramètres clés

  • saturation : contrôle l'intensité des couleurs (de 0 à 1). Des valeurs plus faibles rendent les couleurs plus atténuées ;
  • linewidth : contrôle l'épaisseur des contours de la boîte et des moustaches ;
  • width : contrôle la largeur de la boîte elle-même.

Exemple

Voici un boxplot analysant le jeu de données "Tips". Remarquez comment les points représentant les valeurs aberrantes apparaissent au-dessus des moustaches.

123456789101112131415161718
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
copy
Tâche

Glissez pour commencer à coder

Visualisation de la distance des planètes découvertes par différentes méthodes.

  1. Définir le style sur 'ticks'. Personnaliser le thème en passant un dictionnaire pour modifier l'arrière-plan en 'grey' ('figure.facecolor') et la couleur des graduations en 'white' ('xtick.color' et 'ytick.color').
  2. Créer un boxplot à l'aide du jeu de données planets (df) :
  • Associer 'distance' à l'axe x et 'method' à l'axe y.
  • Définir la width de la boîte à 0.6.
  • Épaissir les lignes avec linewidth=2.
  • Atténuer fortement les couleurs en réglant saturation à 0.4.
  • Utiliser la palette 'vlag'.
  1. Afficher le graphique.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 11
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

some-alt