Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Visualisation des Données Matricielles | Section
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Visualisation Statistique Avec Seaborn

bookVisualisation des Données Matricielles

Une heatmap (carte thermique) est un graphique où les valeurs des données sont représentées par des couleurs dans une matrice.

C'est la méthode standard pour visualiser les matrices de corrélation (comment les variables sont liées entre elles) ou les grilles de séries temporelles (par exemple, mois vs années).

Important : contrairement à scatterplot ou barplot qui utilisent de longues listes de données, heatmap nécessite généralement que vos données soient au format matrice (2D). Cela s'obtient souvent en utilisant df.pivot_table() avant la visualisation.

Paramètres clés

  • annot=True : affiche la valeur de la donnée dans chaque cellule ;
  • cmap : la palette de couleurs (gradient) à utiliser. Choix courants : 'viridis', 'coolwarm', 'magma' ;
  • fmt : code de formatage de chaîne pour contrôler l'affichage des nombres ;
  • 'd' : entiers (sans décimales) ;
  • '.2f' : flottants avec 2 décimales ;
  • 'g' : format général (compact) ;
  • linewidths / linecolor : ajoute des bordures distinctes entre les cellules.

Exemple

Voici une carte thermique montrant la corrélation entre les variables numériques du jeu de données tips.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation du nombre de passagers aériens au fil des années. Les données ont déjà été restructurées sous forme de matrice (upd_df) à l'aide de pivot_table.

  1. Définir le style sur 'ticks'. Modifier la couleur de fond de la figure en 'seagreen' ('figure.facecolor').
  2. Créer une carte thermique :
  • Utiliser upd_df comme données (c'est le premier argument, donc inutile de préciser data=).
  • Employer la palette de couleurs 'viridis' (cmap).
  • Afficher les valeurs dans les cellules (annot=True).
  • Formater les nombres avec '0.99g' (format général).
  • Définir la couleur des lignes entre les cellules sur 'plum' (linecolor).
  1. Afficher le graphique.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 16
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookVisualisation des Données Matricielles

Glissez pour afficher le menu

Une heatmap (carte thermique) est un graphique où les valeurs des données sont représentées par des couleurs dans une matrice.

C'est la méthode standard pour visualiser les matrices de corrélation (comment les variables sont liées entre elles) ou les grilles de séries temporelles (par exemple, mois vs années).

Important : contrairement à scatterplot ou barplot qui utilisent de longues listes de données, heatmap nécessite généralement que vos données soient au format matrice (2D). Cela s'obtient souvent en utilisant df.pivot_table() avant la visualisation.

Paramètres clés

  • annot=True : affiche la valeur de la donnée dans chaque cellule ;
  • cmap : la palette de couleurs (gradient) à utiliser. Choix courants : 'viridis', 'coolwarm', 'magma' ;
  • fmt : code de formatage de chaîne pour contrôler l'affichage des nombres ;
  • 'd' : entiers (sans décimales) ;
  • '.2f' : flottants avec 2 décimales ;
  • 'g' : format général (compact) ;
  • linewidths / linecolor : ajoute des bordures distinctes entre les cellules.

Exemple

Voici une carte thermique montrant la corrélation entre les variables numériques du jeu de données tips.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation du nombre de passagers aériens au fil des années. Les données ont déjà été restructurées sous forme de matrice (upd_df) à l'aide de pivot_table.

  1. Définir le style sur 'ticks'. Modifier la couleur de fond de la figure en 'seagreen' ('figure.facecolor').
  2. Créer une carte thermique :
  • Utiliser upd_df comme données (c'est le premier argument, donc inutile de préciser data=).
  • Employer la palette de couleurs 'viridis' (cmap).
  • Afficher les valeurs dans les cellules (annot=True).
  • Formater les nombres avec '0.99g' (format général).
  • Définir la couleur des lignes entre les cellules sur 'plum' (linecolor).
  1. Afficher le graphique.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 16
single

single

some-alt