Visualisation de Nuages de Points Catégoriels
En statistique, une variable catégorielle est une variable qui ne peut prendre qu'une valeur parmi un nombre limité de possibilités (par exemple, "Jour de la semaine", "Genre", "Pays").
Un stripplot est essentiellement un nuage de points où l'un des axes représente une variable catégorielle. Il permet de visualiser la distribution de nombreuses valeurs individuelles unidimensionnelles.
Pourquoi utiliser un Stripplot ?
Contrairement à un histogramme ou à une courbe de densité qui agrègent les données, un stripplot affiche chaque observation individuelle sous forme de point. Cela convient parfaitement aux petits ensembles de données lorsque l'on souhaite observer la répartition exacte et identifier les valeurs aberrantes.
Paramètres clés pour la personnalisation
Comme les points peuvent se superposer (un problème appelé "overplotting"), stripplot propose plusieurs options pour les différencier :
alpha: contrôle la transparence (de 0 à 1). Une valeur faible (par exemple,0.25) permet de visualiser la densité — les zones plus foncées indiquent une concentration de points ;size: modifie le rayon des points ;marker: modifie la forme des points (par exemple,'D'pour les losanges,'s'pour les carrés) ;jitter: ajoute un léger bruit aléatoire à la position des points pour éviter qu'ils ne se superposent exactement (activé par défaut).
Exemple interactif
Voici comment créer un stripplot utilisant la transparence pour gérer la superposition des données.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualisation de la distribution des additions par jour avec un style personnalisé.
- Définir le style sur
'whitegrid'. Passer un dictionnaire pour définir la couleur de fond ('axes.facecolor') sur'aliceblue'. - Créer un stripplot en utilisant le jeu de données
tips(df) :
- Mapper
'day'sur l’axexet'total_bill'sur l’axey. - Colorer les points selon le statut
'smoker'à l’aide dehue. - Définir la
sizedes points à20. - Utiliser la palette
'crest'. - Changer la forme du marqueur en losange avec
marker='D'. - Régler la transparence (
alpha) à0.25.
- Afficher le graphique.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 4.55
Visualisation de Nuages de Points Catégoriels
Glissez pour afficher le menu
En statistique, une variable catégorielle est une variable qui ne peut prendre qu'une valeur parmi un nombre limité de possibilités (par exemple, "Jour de la semaine", "Genre", "Pays").
Un stripplot est essentiellement un nuage de points où l'un des axes représente une variable catégorielle. Il permet de visualiser la distribution de nombreuses valeurs individuelles unidimensionnelles.
Pourquoi utiliser un Stripplot ?
Contrairement à un histogramme ou à une courbe de densité qui agrègent les données, un stripplot affiche chaque observation individuelle sous forme de point. Cela convient parfaitement aux petits ensembles de données lorsque l'on souhaite observer la répartition exacte et identifier les valeurs aberrantes.
Paramètres clés pour la personnalisation
Comme les points peuvent se superposer (un problème appelé "overplotting"), stripplot propose plusieurs options pour les différencier :
alpha: contrôle la transparence (de 0 à 1). Une valeur faible (par exemple,0.25) permet de visualiser la densité — les zones plus foncées indiquent une concentration de points ;size: modifie le rayon des points ;marker: modifie la forme des points (par exemple,'D'pour les losanges,'s'pour les carrés) ;jitter: ajoute un léger bruit aléatoire à la position des points pour éviter qu'ils ne se superposent exactement (activé par défaut).
Exemple interactif
Voici comment créer un stripplot utilisant la transparence pour gérer la superposition des données.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
Swipe to start coding
Visualisation de la distribution des additions par jour avec un style personnalisé.
- Définir le style sur
'whitegrid'. Passer un dictionnaire pour définir la couleur de fond ('axes.facecolor') sur'aliceblue'. - Créer un stripplot en utilisant le jeu de données
tips(df) :
- Mapper
'day'sur l’axexet'total_bill'sur l’axey. - Colorer les points selon le statut
'smoker'à l’aide dehue. - Définir la
sizedes points à20. - Utiliser la palette
'crest'. - Changer la forme du marqueur en losange avec
marker='D'. - Régler la transparence (
alpha) à0.25.
- Afficher le graphique.
Solution
Merci pour vos commentaires !
single