Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Graphe de Paires | Visualisation avec Seaborn
Quizzes & Challenges
Quizzes
Challenges
/
Visualisation Ultime Avec Python

bookGraphe de Paires

Note
Définition

Un pair plot visualise les relations par paires entre toutes les variables numériques d’un jeu de données. Contrairement à un joint plot, il n’est pas limité à deux variables. Il crée une grille de sous-graphes de taille N×N, où N correspond au nombre de colonnes numériques dans le DataFrame.

Exemple de pair plot

Description du Pair Plot

Chaque colonne de la grille partage la même variable pour l’axe des x, et chaque ligne partage la même variable pour l’axe des y. La diagonale affiche les histogrammes des variables individuelles, tandis que les cellules hors diagonale présentent des nuages de points.

Création d’un Pair Plot

Vous pouvez en créer un avec seaborn.pairplot(). Son seul argument obligatoire est data, qui doit être un DataFrame. Les paramètres comme height et aspect définissent la taille (en pouces) de chaque sous-graphe.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hue

Le paramètre hue attribue des couleurs en fonction d’une colonne catégorielle spécifiée. Cela met en évidence les différences entre groupes et, dans les jeux de données de classification, montre comment les classes se séparent selon les paires de variables.

Lorsque hue est défini (par exemple sur species), les nuages de points colorient les points par classe, et les graphiques diagonaux passent des histogrammes aux KDE plots, rendant les distributions des classes plus claires.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Modification des types de graphiques

Personnalisation possible des graphiques principaux et diagonaux.

  • kind contrôle les graphiques hors diagonale (par défaut : 'scatter') ;
  • diag_kind contrôle la diagonale (histogramme ou KDE, souvent choisi automatiquement lorsque hue est utilisé).
12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' sont des valeurs possibles pour le paramètre kind.

diag_kind peut être défini sur l'une des valeurs suivantes :

  • 'auto' ;
  • 'hist' ;
  • 'kde' ;
  • None.

Tout cela est similaire à la fonction jointplot() à cet égard.

Note
Approfondir

Explorez davantage dans la documentation de pairplot().

Tâche

Swipe to start coding

  1. Utiliser la fonction appropriée pour créer un pair plot.
  2. Définir les données du graphique sur penguins_df via le premier argument.
  3. Définir 'sex' comme colonne pour mapper les aspects du graphique à différentes couleurs en spécifiant le deuxième argument.
  4. Définir les graphiques non diagonaux pour afficher une ligne de régression ('reg') en spécifiant le troisième argument.
  5. Définir height à 2.
  6. Définir aspect à 0.8.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 6
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

What does the `aspect` parameter do in `pairplot()`?

Can you explain the difference between `hist` and `kde` on the diagonal?

How does using `hue` affect the appearance of the pair plot?

close

Awesome!

Completion rate improved to 3.85

bookGraphe de Paires

Glissez pour afficher le menu

Note
Définition

Un pair plot visualise les relations par paires entre toutes les variables numériques d’un jeu de données. Contrairement à un joint plot, il n’est pas limité à deux variables. Il crée une grille de sous-graphes de taille N×N, où N correspond au nombre de colonnes numériques dans le DataFrame.

Exemple de pair plot

Description du Pair Plot

Chaque colonne de la grille partage la même variable pour l’axe des x, et chaque ligne partage la même variable pour l’axe des y. La diagonale affiche les histogrammes des variables individuelles, tandis que les cellules hors diagonale présentent des nuages de points.

Création d’un Pair Plot

Vous pouvez en créer un avec seaborn.pairplot(). Son seul argument obligatoire est data, qui doit être un DataFrame. Les paramètres comme height et aspect définissent la taille (en pouces) de chaque sous-graphe.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

Hue

Le paramètre hue attribue des couleurs en fonction d’une colonne catégorielle spécifiée. Cela met en évidence les différences entre groupes et, dans les jeux de données de classification, montre comment les classes se séparent selon les paires de variables.

Lorsque hue est défini (par exemple sur species), les nuages de points colorient les points par classe, et les graphiques diagonaux passent des histogrammes aux KDE plots, rendant les distributions des classes plus claires.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Modification des types de graphiques

Personnalisation possible des graphiques principaux et diagonaux.

  • kind contrôle les graphiques hors diagonale (par défaut : 'scatter') ;
  • diag_kind contrôle la diagonale (histogramme ou KDE, souvent choisi automatiquement lorsque hue est utilisé).
12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' sont des valeurs possibles pour le paramètre kind.

diag_kind peut être défini sur l'une des valeurs suivantes :

  • 'auto' ;
  • 'hist' ;
  • 'kde' ;
  • None.

Tout cela est similaire à la fonction jointplot() à cet égard.

Note
Approfondir

Explorez davantage dans la documentation de pairplot().

Tâche

Swipe to start coding

  1. Utiliser la fonction appropriée pour créer un pair plot.
  2. Définir les données du graphique sur penguins_df via le premier argument.
  3. Définir 'sex' comme colonne pour mapper les aspects du graphique à différentes couleurs en spécifiant le deuxième argument.
  4. Définir les graphiques non diagonaux pour afficher une ligne de régression ('reg') en spécifiant le troisième argument.
  5. Définir height à 2.
  6. Définir aspect à 0.8.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 6
single

single

some-alt