Contenu du cours
Visualisation Ultime Avec Python
Visualisation Ultime Avec Python
Tracé KDE
L'estimation de la densité par noyau (KDE) est un graphique utilisé pour visualiser l'estimation de la fonction de densité de probabilité. Il est d'une certaine manière similaire à un histogramme que nous avons discuté dans la section précédente, cependant, le graphique KDE est une courbe continue, pas un ensemble de barres, et est basé sur tous les points de données plutôt que sur les intervalles. Jetons un coup d'œil à un exemple de graphique KDE :
Comme vous pouvez le voir, ici nous avons un histogramme combiné avec un graphique KDE (courbe orange). Cette combinaison nous donne une approximation de la fonction de densité de probabilité beaucoup plus claire qu'un simple histogramme.
Avec seaborn
, créer un graphique KDE est aussi simple que possible, puisqu'il existe une fonction spéciale kdeplot()
. Ses paramètres les plus importants data
, x
et y
fonctionnent de la même manière que dans la fonction countplot()
.
Première Option
Nous pouvons simplement définir l'un de ces paramètres en passant une séquence de valeurs. Voici un exemple pour clarifier le tout :
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
Nous définissons uniquement la valeur pour le paramètre data
en passant un objet Series
et utilisons le paramètre fill
pour remplir la zone sous la courbe (elle n'est pas remplie par défaut).
Deuxième Option
Il est également possible de définir un objet 2D comme un DataFrame
pour data
et un nom de colonne (ou une clé si le data
est un dictionnaire) pour x
(orientation verticale) ou y
(orientation horizontale):
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Nous avons obtenu les mêmes résultats en passant le DataFrame
entier comme paramètre data
et le nom de colonne pour le paramètre x
.
D'ailleurs, le graphique KDE que nous avons créé a une courbe en cloche caractéristique et ressemble de près à la distribution normale avec une moyenne d'environ 52°F.
Si vous souhaitez explorer davantage la fonction kdeplot()
, n'hésitez pas à consulter sa documentation.
Swipe to start coding
- Utilisez la fonction correcte pour créer un tracé KDE.
- Utilisez
countries_df
comme données pour le tracé (le premier argument). - Définissez
'GDP per capita'
comme la colonne à utiliser et l'orientation à horizontale via le deuxième argument. - Remplissez la zone sous la courbe via le troisième argument (le plus à droite).
Solution
Merci pour vos commentaires !
Tracé KDE
L'estimation de la densité par noyau (KDE) est un graphique utilisé pour visualiser l'estimation de la fonction de densité de probabilité. Il est d'une certaine manière similaire à un histogramme que nous avons discuté dans la section précédente, cependant, le graphique KDE est une courbe continue, pas un ensemble de barres, et est basé sur tous les points de données plutôt que sur les intervalles. Jetons un coup d'œil à un exemple de graphique KDE :
Comme vous pouvez le voir, ici nous avons un histogramme combiné avec un graphique KDE (courbe orange). Cette combinaison nous donne une approximation de la fonction de densité de probabilité beaucoup plus claire qu'un simple histogramme.
Avec seaborn
, créer un graphique KDE est aussi simple que possible, puisqu'il existe une fonction spéciale kdeplot()
. Ses paramètres les plus importants data
, x
et y
fonctionnent de la même manière que dans la fonction countplot()
.
Première Option
Nous pouvons simplement définir l'un de ces paramètres en passant une séquence de valeurs. Voici un exemple pour clarifier le tout :
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
Nous définissons uniquement la valeur pour le paramètre data
en passant un objet Series
et utilisons le paramètre fill
pour remplir la zone sous la courbe (elle n'est pas remplie par défaut).
Deuxième Option
Il est également possible de définir un objet 2D comme un DataFrame
pour data
et un nom de colonne (ou une clé si le data
est un dictionnaire) pour x
(orientation verticale) ou y
(orientation horizontale):
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Nous avons obtenu les mêmes résultats en passant le DataFrame
entier comme paramètre data
et le nom de colonne pour le paramètre x
.
D'ailleurs, le graphique KDE que nous avons créé a une courbe en cloche caractéristique et ressemble de près à la distribution normale avec une moyenne d'environ 52°F.
Si vous souhaitez explorer davantage la fonction kdeplot()
, n'hésitez pas à consulter sa documentation.
Swipe to start coding
- Utilisez la fonction correcte pour créer un tracé KDE.
- Utilisez
countries_df
comme données pour le tracé (le premier argument). - Définissez
'GDP per capita'
comme la colonne à utiliser et l'orientation à horizontale via le deuxième argument. - Remplissez la zone sous la courbe via le troisième argument (le plus à droite).
Solution
Merci pour vos commentaires !