Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Visualisation de Nuages de Points Catégoriels | Section
Visualisation Statistique Avec Seaborn

bookVisualisation de Nuages de Points Catégoriels

En statistique, une variable catégorielle est une variable qui ne peut prendre qu'une valeur parmi un nombre limité de possibilités (par exemple, "Jour de la semaine", "Genre", "Pays").

Un stripplot est essentiellement un nuage de points où l'un des axes représente une variable catégorielle. Il permet de visualiser la distribution de nombreuses valeurs individuelles unidimensionnelles.

Pourquoi utiliser un Stripplot ?

Contrairement à un histogramme ou à une courbe de densité qui agrègent les données, un stripplot affiche chaque observation individuelle sous forme de point. Cela convient parfaitement aux petits ensembles de données lorsque l'on souhaite observer la répartition exacte et identifier les valeurs aberrantes.

Paramètres clés pour la personnalisation

Comme les points peuvent se superposer (un problème appelé "overplotting"), stripplot propose plusieurs options pour les différencier :

  • alpha : contrôle la transparence (de 0 à 1). Une valeur faible (par exemple, 0.25) permet de visualiser la densité — les zones plus foncées indiquent une concentration de points ;
  • size : modifie le rayon des points ;
  • marker : modifie la forme des points (par exemple, 'D' pour les losanges, 's' pour les carrés) ;
  • jitter : ajoute un léger bruit aléatoire à la position des points pour éviter qu'ils ne se superposent exactement (activé par défaut).

Exemple interactif

Voici comment créer un stripplot utilisant la transparence pour gérer la superposition des données.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation de la distribution des additions par jour avec un style personnalisé.

  1. Définir le style sur 'whitegrid'. Passer un dictionnaire pour définir la couleur de fond ('axes.facecolor') sur 'aliceblue'.
  2. Créer un stripplot en utilisant le jeu de données tips (df) :
  • Mapper 'day' sur l’axe x et 'total_bill' sur l’axe y.
  • Colorer les points selon le statut 'smoker' à l’aide de hue.
  • Définir la size des points à 20.
  • Utiliser la palette 'crest'.
  • Changer la forme du marqueur en losange avec marker='D'.
  • Régler la transparence (alpha) à 0.25.
  1. Afficher le graphique.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 9
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookVisualisation de Nuages de Points Catégoriels

Glissez pour afficher le menu

En statistique, une variable catégorielle est une variable qui ne peut prendre qu'une valeur parmi un nombre limité de possibilités (par exemple, "Jour de la semaine", "Genre", "Pays").

Un stripplot est essentiellement un nuage de points où l'un des axes représente une variable catégorielle. Il permet de visualiser la distribution de nombreuses valeurs individuelles unidimensionnelles.

Pourquoi utiliser un Stripplot ?

Contrairement à un histogramme ou à une courbe de densité qui agrègent les données, un stripplot affiche chaque observation individuelle sous forme de point. Cela convient parfaitement aux petits ensembles de données lorsque l'on souhaite observer la répartition exacte et identifier les valeurs aberrantes.

Paramètres clés pour la personnalisation

Comme les points peuvent se superposer (un problème appelé "overplotting"), stripplot propose plusieurs options pour les différencier :

  • alpha : contrôle la transparence (de 0 à 1). Une valeur faible (par exemple, 0.25) permet de visualiser la densité — les zones plus foncées indiquent une concentration de points ;
  • size : modifie le rayon des points ;
  • marker : modifie la forme des points (par exemple, 'D' pour les losanges, 's' pour les carrés) ;
  • jitter : ajoute un léger bruit aléatoire à la position des points pour éviter qu'ils ne se superposent exactement (activé par défaut).

Exemple interactif

Voici comment créer un stripplot utilisant la transparence pour gérer la superposition des données.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation de la distribution des additions par jour avec un style personnalisé.

  1. Définir le style sur 'whitegrid'. Passer un dictionnaire pour définir la couleur de fond ('axes.facecolor') sur 'aliceblue'.
  2. Créer un stripplot en utilisant le jeu de données tips (df) :
  • Mapper 'day' sur l’axe x et 'total_bill' sur l’axe y.
  • Colorer les points selon le statut 'smoker' à l’aide de hue.
  • Définir la size des points à 20.
  • Utiliser la palette 'crest'.
  • Changer la forme du marqueur en losange avec marker='D'.
  • Régler la transparence (alpha) à 0.25.
  1. Afficher le graphique.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 9
single

single

some-alt