Contenu du cours
Visualisation Ultime Avec Python
Visualisation Ultime Avec Python
Carte Thermique
Une carte thermique est une méthode de visualisation de données bidimensionnelles utilisant des couleurs pour représenter l'amplitude de chaque valeur. Voici un exemple de carte thermique :
Dans cet exemple, nous avons utilisé une carte thermique pour représenter la corrélation par paire entre les variables d'un ensemble de données. Avec une telle carte thermique, tout est net et clair, exactement ce dont nous avons besoin pour une bonne visualisation.
Création d'une Heatmap Simple
seaborn
a une fonction appelée heatmap()
. Son seul paramètre obligatoire est data
qui doit être un ensemble de données 2D (rectangle).
Peut-être que le cas d'utilisation le plus courant d'une heatmap est avec une matrice de corrélation comme dans l'exemple ci-dessus. Étant donné un DataFrame
, nous devrions d'abord appeler sa méthode corr()
pour obtenir une matrice de corrélation et seulement ensuite passer cette matrice comme argument pour la fonction heatmap()
:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
Tout est assez simple ici, cependant, nous n'avons pas utilisé toutes les colonnes du DataFrame
pour créer une matrice de corrélation (numeric_only=True
), car elles contiennent des chaînes de caractères et ne sont pas numériques.
Annotation et Couleurs
Cette carte thermique peut être rendue plus informative en écrivant la valeur appropriée (coefficient de corrélation dans notre cas) dans chaque cellule. Cela peut être fait simplement en définissant le paramètre annot
à True
.
Il est également possible de changer les couleurs de notre carte thermique en définissant le paramètre cmap
(vous pouvez explorer les palettes ici).
Avec cela en tête, modifions maintenant notre exemple :
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
Nous pourrions également supprimer la barre de couleur à droite en définissant cbar=False
.
Dans la plupart des cas, c'est tout ce dont vous aurez besoin pour une personnalisation de carte thermique, cependant, vous pouvez toujours explorer plus dans sa documentation.
Améliorer la Lisibilité
La dernière chose qui améliorerait la lisibilité de notre carte thermique est de faire pivoter les graduations en utilisant les fonctions xticks()
et yticks()
déjà familières :
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
Swipe to start coding
- Utilisez la méthode correcte pour créer une matrice de corrélation.
- Définissez l'argument de la méthode pour inclure uniquement les variables numériques.
- Utilisez la fonction correcte pour créer une carte thermique.
- Définissez
correlation_matrix
comme étant les données pour la carte thermique en spécifiant le premier argument. - Ajoutez les valeurs dans chaque cellule de la matrice en spécifiant le deuxième argument.
- Définissez la palette (carte de couleurs) de la carte thermique à
'crest'
en spécifiant le troisième argument (le plus à droite). - Faites pivoter les graduations des axes x et y de 15 degrés dans le sens antihoraire en spécifiant un argument mot-clé dans
xticks()
etyticks()
.
Solution
Merci pour vos commentaires !
Carte Thermique
Une carte thermique est une méthode de visualisation de données bidimensionnelles utilisant des couleurs pour représenter l'amplitude de chaque valeur. Voici un exemple de carte thermique :
Dans cet exemple, nous avons utilisé une carte thermique pour représenter la corrélation par paire entre les variables d'un ensemble de données. Avec une telle carte thermique, tout est net et clair, exactement ce dont nous avons besoin pour une bonne visualisation.
Création d'une Heatmap Simple
seaborn
a une fonction appelée heatmap()
. Son seul paramètre obligatoire est data
qui doit être un ensemble de données 2D (rectangle).
Peut-être que le cas d'utilisation le plus courant d'une heatmap est avec une matrice de corrélation comme dans l'exemple ci-dessus. Étant donné un DataFrame
, nous devrions d'abord appeler sa méthode corr()
pour obtenir une matrice de corrélation et seulement ensuite passer cette matrice comme argument pour la fonction heatmap()
:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
Tout est assez simple ici, cependant, nous n'avons pas utilisé toutes les colonnes du DataFrame
pour créer une matrice de corrélation (numeric_only=True
), car elles contiennent des chaînes de caractères et ne sont pas numériques.
Annotation et Couleurs
Cette carte thermique peut être rendue plus informative en écrivant la valeur appropriée (coefficient de corrélation dans notre cas) dans chaque cellule. Cela peut être fait simplement en définissant le paramètre annot
à True
.
Il est également possible de changer les couleurs de notre carte thermique en définissant le paramètre cmap
(vous pouvez explorer les palettes ici).
Avec cela en tête, modifions maintenant notre exemple :
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
Nous pourrions également supprimer la barre de couleur à droite en définissant cbar=False
.
Dans la plupart des cas, c'est tout ce dont vous aurez besoin pour une personnalisation de carte thermique, cependant, vous pouvez toujours explorer plus dans sa documentation.
Améliorer la Lisibilité
La dernière chose qui améliorerait la lisibilité de notre carte thermique est de faire pivoter les graduations en utilisant les fonctions xticks()
et yticks()
déjà familières :
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
Swipe to start coding
- Utilisez la méthode correcte pour créer une matrice de corrélation.
- Définissez l'argument de la méthode pour inclure uniquement les variables numériques.
- Utilisez la fonction correcte pour créer une carte thermique.
- Définissez
correlation_matrix
comme étant les données pour la carte thermique en spécifiant le premier argument. - Ajoutez les valeurs dans chaque cellule de la matrice en spécifiant le deuxième argument.
- Définissez la palette (carte de couleurs) de la carte thermique à
'crest'
en spécifiant le troisième argument (le plus à droite). - Faites pivoter les graduations des axes x et y de 15 degrés dans le sens antihoraire en spécifiant un argument mot-clé dans
xticks()
etyticks()
.
Solution
Merci pour vos commentaires !