Graphe de Paires
Pair plot est utilisé pour représenter graphiquement les relations par paires entre les variables numériques d'un ensemble de données. Il est assez similaire à un joint plot, cependant, il n'est pas limité à seulement deux variables. En effet, un pair plot crée une grille NxN
d'objets Axes
(plusieurs sous-graphiques) où N
correspond au nombre de variables numériques (colonnes numériques dans un DataFrame
).

Description du Pair Plot
Dans un pair plot, chaque colonne partage la même variable sur l’axe des x, et chaque ligne partage la même variable sur l’axe des y. La diagonale affiche les histogrammes des variables individuelles, tandis que les autres graphiques présentent des nuages de points.
Création d'un Pair Plot
La création d'un pair plot avec seaborn
consiste à appeler sa fonction pairplot()
. Son paramètre le plus important et le seul obligatoire est data
, qui doit être un objet DataFrame
.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
Le DataFrame iris_df
est transmis à la fonction pairplot()
. Les paramètres height
et aspect
définissent la hauteur et la largeur (calculée comme la hauteur multipliée par l'aspect) de chaque facette en pouces.
Hue
Un autre paramètre qui mérite d'être mentionné est hue
, qui spécifie la variable (nom de colonne) dans data
à utiliser pour associer différents aspects du graphique à des couleurs différentes ou même créer des graphiques séparés (sur un même Axes
) pour chacune de ses valeurs.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
La différence est ici clairement visible. Les points de données dans chaque nuage de points sont colorés en fonction de la s espèce à laquelle ils appartiennent, en utilisant les valeurs de la colonne species. Les graphiques diagonaux sont désormais des graphiques KDE pour chaque espèce au lieu d'histogrammes.
Dans les problèmes de classification, il est souvent pertinent de créer un pair plot avec le paramètre hue
défini sur la variable cible, c'est-à-dire la variable catégorielle que l'on souhaite prédire.
La différence est nette. Les points de données dans chaque nuage de points sont colorés selon leur espèce, basée sur les valeurs de la colonne species. Les graphiques diagonaux ont été remplacés par des graphiques KDE pour chaque espèce au lieu d'histogrammes.
Dans les tâches de classification, il est souvent utile de créer un pair plot avec le paramètre hue
défini sur la variable cible — la variable catégorielle à prédire.
Modification des types de graphiques
Il est possible de modifier le type de graphiques utilisés à la place des nuages de points par défaut, ainsi que les graphiques affichés sur la diagonale. Le paramètre kind
contrôle les graphiques principaux et utilise par défaut les nuages de points, tandis que le paramètre diag_kind
contrôle les graphiques diagonaux et est automatiquement choisi selon que le paramètre hue
est défini ou non.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter'
, 'kde'
, 'hist'
, 'reg'
sont les valeurs possibles pour le paramètre kind
.
diag_kind
peut être défini sur l'une des valeurs suivantes :
'auto'
;'hist'
;'kde'
;None
.
Tout cela fonctionne de manière similaire à la fonction jointplot()
à cet égard.
Explorez davantage dans la documentation pairplot()
.
Swipe to start coding
- Utiliser la fonction appropriée pour créer un pair plot.
- Définir les données du graphique sur
penguins_df
via le premier argument. - Définir
'sex'
comme colonne pour associer les aspects du graphique à différentes couleurs en spécifiant le deuxième argument. - Définir les graphiques non diagonaux pour afficher une ligne de régression (
'reg'
) en spécifiant le troisième argument. - Définir
height
à2
. - Définir
aspect
à0.8
.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
What other parameters can I use with the pairplot() function?
Can you explain the difference between 'kind' and 'diag_kind' in more detail?
How do I interpret the KDE plots on the diagonal?
Awesome!
Completion rate improved to 3.85
Graphe de Paires
Glissez pour afficher le menu
Pair plot est utilisé pour représenter graphiquement les relations par paires entre les variables numériques d'un ensemble de données. Il est assez similaire à un joint plot, cependant, il n'est pas limité à seulement deux variables. En effet, un pair plot crée une grille NxN
d'objets Axes
(plusieurs sous-graphiques) où N
correspond au nombre de variables numériques (colonnes numériques dans un DataFrame
).

Description du Pair Plot
Dans un pair plot, chaque colonne partage la même variable sur l’axe des x, et chaque ligne partage la même variable sur l’axe des y. La diagonale affiche les histogrammes des variables individuelles, tandis que les autres graphiques présentent des nuages de points.
Création d'un Pair Plot
La création d'un pair plot avec seaborn
consiste à appeler sa fonction pairplot()
. Son paramètre le plus important et le seul obligatoire est data
, qui doit être un objet DataFrame
.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
Le DataFrame iris_df
est transmis à la fonction pairplot()
. Les paramètres height
et aspect
définissent la hauteur et la largeur (calculée comme la hauteur multipliée par l'aspect) de chaque facette en pouces.
Hue
Un autre paramètre qui mérite d'être mentionné est hue
, qui spécifie la variable (nom de colonne) dans data
à utiliser pour associer différents aspects du graphique à des couleurs différentes ou même créer des graphiques séparés (sur un même Axes
) pour chacune de ses valeurs.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
La différence est ici clairement visible. Les points de données dans chaque nuage de points sont colorés en fonction de la s espèce à laquelle ils appartiennent, en utilisant les valeurs de la colonne species. Les graphiques diagonaux sont désormais des graphiques KDE pour chaque espèce au lieu d'histogrammes.
Dans les problèmes de classification, il est souvent pertinent de créer un pair plot avec le paramètre hue
défini sur la variable cible, c'est-à-dire la variable catégorielle que l'on souhaite prédire.
La différence est nette. Les points de données dans chaque nuage de points sont colorés selon leur espèce, basée sur les valeurs de la colonne species. Les graphiques diagonaux ont été remplacés par des graphiques KDE pour chaque espèce au lieu d'histogrammes.
Dans les tâches de classification, il est souvent utile de créer un pair plot avec le paramètre hue
défini sur la variable cible — la variable catégorielle à prédire.
Modification des types de graphiques
Il est possible de modifier le type de graphiques utilisés à la place des nuages de points par défaut, ainsi que les graphiques affichés sur la diagonale. Le paramètre kind
contrôle les graphiques principaux et utilise par défaut les nuages de points, tandis que le paramètre diag_kind
contrôle les graphiques diagonaux et est automatiquement choisi selon que le paramètre hue
est défini ou non.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter'
, 'kde'
, 'hist'
, 'reg'
sont les valeurs possibles pour le paramètre kind
.
diag_kind
peut être défini sur l'une des valeurs suivantes :
'auto'
;'hist'
;'kde'
;None
.
Tout cela fonctionne de manière similaire à la fonction jointplot()
à cet égard.
Explorez davantage dans la documentation pairplot()
.
Swipe to start coding
- Utiliser la fonction appropriée pour créer un pair plot.
- Définir les données du graphique sur
penguins_df
via le premier argument. - Définir
'sex'
comme colonne pour associer les aspects du graphique à différentes couleurs en spécifiant le deuxième argument. - Définir les graphiques non diagonaux pour afficher une ligne de régression (
'reg'
) en spécifiant le troisième argument. - Définir
height
à2
. - Définir
aspect
à0.8
.
Solution
Merci pour vos commentaires !
single