Résumé des données avec des boîtes à moustaches
Un boxplot est une méthode standardisée pour afficher la distribution des données basée sur un résumé à cinq chiffres :
- Minimum (valeur la plus basse, hors valeurs aberrantes) ;
- Premier quartile (Q1) (25e centile) ;
- Médiane (50e centile) ;
- Troisième quartile (Q3) (75e centile) ;
- Maximum (valeur la plus élevée, hors valeurs aberrantes).
Pourquoi utiliser un boxplot ?
Il s'agit du meilleur outil pour comparer les distributions entre groupes. Il indique immédiatement :
- Tendance centrale : où se situe la ligne de la médiane ? ;
- Dispersion : quelle est la hauteur de la boîte ? (l'intervalle interquartile) ;
- Symétrie : la médiane est-elle au centre de la boîte ? ;
- Valeurs aberrantes : y a-t-il des points en dehors des moustaches ?
Paramètres clés
saturation: contrôle l'intensité des couleurs (de 0 à 1). Des valeurs plus faibles rendent les couleurs plus atténuées ;linewidth: contrôle l'épaisseur des contours de la boîte et des moustaches ;width: contrôle la largeur de la boîte elle-même.
Exemple
Voici un boxplot analysant le jeu de données "Tips". Remarquez comment les points représentant les valeurs aberrantes apparaissent au-dessus des moustaches.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisation de la distance des planètes découvertes par différentes méthodes.
- Définir le style sur
'ticks'. Personnaliser le thème en passant un dictionnaire pour modifier l'arrière-plan en'grey'('figure.facecolor') et la couleur des graduations en'white'('xtick.color'et'ytick.color'). - Créer un boxplot à l'aide du jeu de données
planets(df) :
- Associer
'distance'à l'axexet'method'à l'axey. - Définir la
widthde la boîte à0.6. - Épaissir les lignes avec
linewidth=2. - Atténuer fortement les couleurs en réglant
saturationà0.4. - Utiliser la palette
'vlag'.
- Afficher le graphique.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 4.55
Résumé des données avec des boîtes à moustaches
Glissez pour afficher le menu
Un boxplot est une méthode standardisée pour afficher la distribution des données basée sur un résumé à cinq chiffres :
- Minimum (valeur la plus basse, hors valeurs aberrantes) ;
- Premier quartile (Q1) (25e centile) ;
- Médiane (50e centile) ;
- Troisième quartile (Q3) (75e centile) ;
- Maximum (valeur la plus élevée, hors valeurs aberrantes).
Pourquoi utiliser un boxplot ?
Il s'agit du meilleur outil pour comparer les distributions entre groupes. Il indique immédiatement :
- Tendance centrale : où se situe la ligne de la médiane ? ;
- Dispersion : quelle est la hauteur de la boîte ? (l'intervalle interquartile) ;
- Symétrie : la médiane est-elle au centre de la boîte ? ;
- Valeurs aberrantes : y a-t-il des points en dehors des moustaches ?
Paramètres clés
saturation: contrôle l'intensité des couleurs (de 0 à 1). Des valeurs plus faibles rendent les couleurs plus atténuées ;linewidth: contrôle l'épaisseur des contours de la boîte et des moustaches ;width: contrôle la largeur de la boîte elle-même.
Exemple
Voici un boxplot analysant le jeu de données "Tips". Remarquez comment les points représentant les valeurs aberrantes apparaissent au-dessus des moustaches.
123456789101112131415161718import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a boxplot sns.boxplot( data=df, hue='day', x='day', y='total_bill', palette='coolwarm', linewidth=2, # Thicker lines saturation=0.7 # Slightly muted colors ) plt.show()
Swipe to start coding
Visualisation de la distance des planètes découvertes par différentes méthodes.
- Définir le style sur
'ticks'. Personnaliser le thème en passant un dictionnaire pour modifier l'arrière-plan en'grey'('figure.facecolor') et la couleur des graduations en'white'('xtick.color'et'ytick.color'). - Créer un boxplot à l'aide du jeu de données
planets(df) :
- Associer
'distance'à l'axexet'method'à l'axey. - Définir la
widthde la boîte à0.6. - Épaissir les lignes avec
linewidth=2. - Atténuer fortement les couleurs en réglant
saturationà0.4. - Utiliser la palette
'vlag'.
- Afficher le graphique.
Solution
Merci pour vos commentaires !
single