Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Estimation de la Densité avec KDE | Section
Visualisation Statistique Avec Seaborn

bookEstimation de la Densité avec KDE

Un kdeplot (estimation de densité par noyau) est une méthode de visualisation de la distribution des observations dans un ensemble de données. Il est analogue à un histogramme, mais au lieu d'utiliser des intervalles discrets, le KDE représente les données à l'aide d'une courbe de densité de probabilité continue.

Cela permet de mieux percevoir la « forme » des données et d'identifier les pics sans l'aspect irrégulier d'un histogramme.

Visualisation de distributions superposées

Lorsque plusieurs catégories sont présentes (en utilisant hue), de simples lignes peuvent devenir difficiles à distinguer. Seaborn propose des paramètres pour résoudre ce problème :

  • Empilement (multiple='stack') : au lieu de tracer les lignes les unes sur les autres, celles-ci sont empilées. Cela permet de visualiser la contribution de chaque catégorie à la distribution totale ;
  • Remplissage (fill=True) : remplit la zone sous la courbe avec de la couleur, rendant le poids visuel de chaque catégorie plus évident.

Exemple :

12345678910111213141516
import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation de la distribution des températures maximales tout au long de l'année :

  1. Importer pandas, seaborn et matplotlib.pyplot.
  2. Lire le jeu de données météorologiques.
  3. Définir le style sur 'ticks' avec une couleur de fond 'lightcyan' (déjà fourni).
  4. Créer un graphique KDE avec les paramètres suivants :
  • Définir x sur 'max_temp' ;
  • Regrouper par 'month' en utilisant hue ;
  • Empiler les distributions avec multiple='stack' ;
  • Remplir les courbes avec fill=True ;
  • Désactiver la légende (legend=False) pour éviter de surcharger le graphique.
  1. Afficher le graphique.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 5
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookEstimation de la Densité avec KDE

Glissez pour afficher le menu

Un kdeplot (estimation de densité par noyau) est une méthode de visualisation de la distribution des observations dans un ensemble de données. Il est analogue à un histogramme, mais au lieu d'utiliser des intervalles discrets, le KDE représente les données à l'aide d'une courbe de densité de probabilité continue.

Cela permet de mieux percevoir la « forme » des données et d'identifier les pics sans l'aspect irrégulier d'un histogramme.

Visualisation de distributions superposées

Lorsque plusieurs catégories sont présentes (en utilisant hue), de simples lignes peuvent devenir difficiles à distinguer. Seaborn propose des paramètres pour résoudre ce problème :

  • Empilement (multiple='stack') : au lieu de tracer les lignes les unes sur les autres, celles-ci sont empilées. Cela permet de visualiser la contribution de chaque catégorie à la distribution totale ;
  • Remplissage (fill=True) : remplit la zone sous la courbe avec de la couleur, rendant le poids visuel de chaque catégorie plus évident.

Exemple :

12345678910111213141516
import seaborn as sns import matplotlib.pyplot as plt # Load built-in dataset df = sns.load_dataset('penguins') # Create the stacked KDE plot sns.kdeplot( data=df, x='flipper_length_mm', hue='species', multiple='stack', # Stack categories vertically fill=True # Fill area with color ) plt.show()
copy
Tâche

Swipe to start coding

Visualisation de la distribution des températures maximales tout au long de l'année :

  1. Importer pandas, seaborn et matplotlib.pyplot.
  2. Lire le jeu de données météorologiques.
  3. Définir le style sur 'ticks' avec une couleur de fond 'lightcyan' (déjà fourni).
  4. Créer un graphique KDE avec les paramètres suivants :
  • Définir x sur 'max_temp' ;
  • Regrouper par 'month' en utilisant hue ;
  • Empiler les distributions avec multiple='stack' ;
  • Remplir les courbes avec fill=True ;
  • Désactiver la légende (legend=False) pour éviter de surcharger le graphique.
  1. Afficher le graphique.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 5
single

single

some-alt