Visualisation des Données Matricielles
Une heatmap (carte thermique) est un graphique où les valeurs des données sont représentées par des couleurs dans une matrice.
C'est la méthode standard pour visualiser les matrices de corrélation (comment les variables sont liées entre elles) ou les grilles de séries temporelles (par exemple, mois vs années).
Important : contrairement à scatterplot ou barplot qui utilisent de longues listes de données, heatmap nécessite généralement que vos données soient au format matrice (2D). Cela s'obtient souvent en utilisant df.pivot_table() avant la visualisation.
Paramètres clés
annot=True: affiche la valeur de la donnée dans chaque cellule ;cmap: la palette de couleurs (gradient) à utiliser. Choix courants :'viridis','coolwarm','magma';fmt: code de formatage de chaîne pour contrôler l'affichage des nombres ;'d': entiers (sans décimales) ;'.2f': flottants avec 2 décimales ;'g': format général (compact) ;linewidths/linecolor: ajoute des bordures distinctes entre les cellules.
Exemple
Voici une carte thermique montrant la corrélation entre les variables numériques du jeu de données tips.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
Swipe to start coding
Visualisation du nombre de passagers aériens au fil des années. Les données ont déjà été restructurées sous forme de matrice (upd_df) à l'aide de pivot_table.
- Définir le style sur
'ticks'. Modifier la couleur de fond de la figure en'seagreen'('figure.facecolor'). - Créer une carte thermique :
- Utiliser
upd_dfcomme données (c'est le premier argument, donc inutile de préciserdata=). - Employer la palette de couleurs
'viridis'(cmap). - Afficher les valeurs dans les cellules (
annot=True). - Formater les nombres avec
'0.99g'(format général). - Définir la couleur des lignes entre les cellules sur
'plum'(linecolor).
- Afficher le graphique.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 4.55
Visualisation des Données Matricielles
Glissez pour afficher le menu
Une heatmap (carte thermique) est un graphique où les valeurs des données sont représentées par des couleurs dans une matrice.
C'est la méthode standard pour visualiser les matrices de corrélation (comment les variables sont liées entre elles) ou les grilles de séries temporelles (par exemple, mois vs années).
Important : contrairement à scatterplot ou barplot qui utilisent de longues listes de données, heatmap nécessite généralement que vos données soient au format matrice (2D). Cela s'obtient souvent en utilisant df.pivot_table() avant la visualisation.
Paramètres clés
annot=True: affiche la valeur de la donnée dans chaque cellule ;cmap: la palette de couleurs (gradient) à utiliser. Choix courants :'viridis','coolwarm','magma';fmt: code de formatage de chaîne pour contrôler l'affichage des nombres ;'d': entiers (sans décimales) ;'.2f': flottants avec 2 décimales ;'g': format général (compact) ;linewidths/linecolor: ajoute des bordures distinctes entre les cellules.
Exemple
Voici une carte thermique montrant la corrélation entre les variables numériques du jeu de données tips.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
Swipe to start coding
Visualisation du nombre de passagers aériens au fil des années. Les données ont déjà été restructurées sous forme de matrice (upd_df) à l'aide de pivot_table.
- Définir le style sur
'ticks'. Modifier la couleur de fond de la figure en'seagreen'('figure.facecolor'). - Créer une carte thermique :
- Utiliser
upd_dfcomme données (c'est le premier argument, donc inutile de préciserdata=). - Employer la palette de couleurs
'viridis'(cmap). - Afficher les valeurs dans les cellules (
annot=True). - Formater les nombres avec
'0.99g'(format général). - Définir la couleur des lignes entre les cellules sur
'plum'(linecolor).
- Afficher le graphique.
Solution
Merci pour vos commentaires !
single