Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Tracé KDE | Tracé avec Seaborn
Visualisation Ultime Avec Python
course content

Contenu du cours

Visualisation Ultime Avec Python

Visualisation Ultime Avec Python

1. Introduction à Matplotlib
2. Création de Graphiques Couramment Utilisés
3. Personnalisation des Graphiques
4. Plus de Graphiques Statistiques
5. Tracé avec Seaborn

book
Tracé KDE

L'estimation de la densité par noyau (KDE) est un graphique utilisé pour visualiser l'estimation de la fonction de densité de probabilité. Il est d'une certaine manière similaire à un histogramme que nous avons discuté dans la section précédente, cependant, le graphique KDE est une courbe continue, pas un ensemble de barres, et est basé sur tous les points de données plutôt que sur les intervalles. Jetons un coup d'œil à un exemple de graphique KDE :

Comme vous pouvez le voir, ici nous avons un histogramme combiné avec un graphique KDE (courbe orange). Cette combinaison nous donne une approximation de la fonction de densité de probabilité beaucoup plus claire qu'un simple histogramme.

Avec seaborn, créer un graphique KDE est aussi simple que possible, puisqu'il existe une fonction spéciale kdeplot(). Ses paramètres les plus importants data, x et y fonctionnent de la même manière que dans la fonction countplot().

Première Option

Nous pouvons simplement définir l'un de ces paramètres en passant une séquence de valeurs. Voici un exemple pour clarifier le tout :

123456789
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Nous définissons uniquement la valeur pour le paramètre data en passant un objet Series et utilisons le paramètre fill pour remplir la zone sous la courbe (elle n'est pas remplie par défaut).

Deuxième Option

Il est également possible de définir un objet 2D comme un DataFrame pour data et un nom de colonne (ou une clé si le data est un dictionnaire) pour x (orientation verticale) ou y (orientation horizontale):

12345678
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

Nous avons obtenu les mêmes résultats en passant le DataFrame entier comme paramètre data et le nom de colonne pour le paramètre x.

D'ailleurs, le graphique KDE que nous avons créé a une courbe en cloche caractéristique et ressemble de près à la distribution normale avec une moyenne d'environ 52°F.

Si vous souhaitez explorer davantage la fonction kdeplot(), n'hésitez pas à consulter sa documentation.

Tâche

Swipe to start coding

  1. Utilisez la fonction correcte pour créer un tracé KDE.
  2. Utilisez countries_df comme données pour le tracé (le premier argument).
  3. Définissez 'GDP per capita' comme la colonne à utiliser et l'orientation à horizontale via le deuxième argument.
  4. Remplissez la zone sous la courbe via le troisième argument (le plus à droite).

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 4
toggle bottom row

book
Tracé KDE

L'estimation de la densité par noyau (KDE) est un graphique utilisé pour visualiser l'estimation de la fonction de densité de probabilité. Il est d'une certaine manière similaire à un histogramme que nous avons discuté dans la section précédente, cependant, le graphique KDE est une courbe continue, pas un ensemble de barres, et est basé sur tous les points de données plutôt que sur les intervalles. Jetons un coup d'œil à un exemple de graphique KDE :

Comme vous pouvez le voir, ici nous avons un histogramme combiné avec un graphique KDE (courbe orange). Cette combinaison nous donne une approximation de la fonction de densité de probabilité beaucoup plus claire qu'un simple histogramme.

Avec seaborn, créer un graphique KDE est aussi simple que possible, puisqu'il existe une fonction spéciale kdeplot(). Ses paramètres les plus importants data, x et y fonctionnent de la même manière que dans la fonction countplot().

Première Option

Nous pouvons simplement définir l'un de ces paramètres en passant une séquence de valeurs. Voici un exemple pour clarifier le tout :

123456789
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' # Loading the dataset with the average yearly temperatures in Boston and Seattle weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
copy

Nous définissons uniquement la valeur pour le paramètre data en passant un objet Series et utilisons le paramètre fill pour remplir la zone sous la courbe (elle n'est pas remplie par défaut).

Deuxième Option

Il est également possible de définir un objet 2D comme un DataFrame pour data et un nom de colonne (ou une clé si le data est un dictionnaire) pour x (orientation verticale) ou y (orientation horizontale):

12345678
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
copy

Nous avons obtenu les mêmes résultats en passant le DataFrame entier comme paramètre data et le nom de colonne pour le paramètre x.

D'ailleurs, le graphique KDE que nous avons créé a une courbe en cloche caractéristique et ressemble de près à la distribution normale avec une moyenne d'environ 52°F.

Si vous souhaitez explorer davantage la fonction kdeplot(), n'hésitez pas à consulter sa documentation.

Tâche

Swipe to start coding

  1. Utilisez la fonction correcte pour créer un tracé KDE.
  2. Utilisez countries_df comme données pour le tracé (le premier argument).
  3. Définissez 'GDP per capita' comme la colonne à utiliser et l'orientation à horizontale via le deuxième argument.
  4. Remplissez la zone sous la courbe via le troisième argument (le plus à droite).

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 4
Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
We're sorry to hear that something went wrong. What happened?
some-alt