Diagramme Conjoint
Joint plot est un graphique assez unique, car il combine plusieurs graphiques. Il s'agit d'un graphique qui montre la relation entre deux variables ainsi que leurs distributions individuelles.
Fondamentalement, il comporte trois éléments par défaut :
Histogramme en haut représentant la distribution d'une variable donnée ;
Histogramme à droite représentant la distribution d'une autre variable ;
Nuage de points au centre montrant la relation entre ces deux variables.
Voici un exemple de joint plot :
Données pour le Joint Plot
seaborn
propose une fonction jointplot()
qui, de manière similaire à countplot()
et kdeplot()
, possède trois paramètres les plus importants :
data
;x
;y
.
Les paramètres x
et y
spécifient les variables à représenter, qui correspondent aux histogrammes à droite et en haut. Ces paramètres peuvent être des objets de type array ou des noms de colonnes lorsque le paramètre data
est un DataFrame.
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
L'exemple initial a été recréé en attribuant un DataFrame au paramètre data
et en spécifiant les noms de colonnes pour x
et y
.
Graphique au centre
Un autre paramètre très utile est kind
, qui spécifie le graphique affiché au centre. Sa valeur par défaut est 'scatter'
. Voici d'autres types de graphiques possibles : 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. N'hésitez pas à expérimenter avec différents graphiques :
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Types de graphiques
Bien que le nuage de points soit le choix le plus courant pour le graphique central, plusieurs autres options sont disponibles :
reg : Ajoute un ajustement par régression linéaire au nuage de points, utile pour vérifier la corrélation entre les variables ;
resid : Affiche les résidus d'une régression linéaire ;
hist : Présente un histogramme bivarié pour deux variables ;
kde : Génère un graphique KDE ;
hex : Produit un graphique hexbin, où des hexagones remplacent les points individuels et la couleur indique la densité des données.
Comme d'habitude, il est possible d'explorer davantage d'options et de paramètres dans la documentation de jointplot()
.
Il est également pertinent d'explorer les sujets mentionnés :
documentation de residplot()
;
Exemple d'histogramme bivarié ;
Exemple de graphique hexbin.
Swipe to start coding
- Utiliser la fonction appropriée pour créer un joint plot.
- Utiliser
weather_df
comme données pour le graphique (premier argument). - Définir la colonne
'Boston'
comme variable de l’axe des abscisses (deuxième argument). - Définir la colonne
'Seattle'
comme variable de l’axe des ordonnées (troisième argument). - Configurer le graphique central pour afficher une droite de régression (dernier argument).
Solution
Merci pour vos commentaires !