Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Visualisation des Histogrammes | Section
Visualisation Statistique Avec Seaborn

bookVisualisation des Histogrammes

Le histplot (diagramme en histogramme) est un outil classique qui représente la distribution d'une ou plusieurs variables en comptant le nombre d'observations qui se trouvent dans des intervalles discrets. Il permet de répondre à des questions telles que : « Quelle est la valeur la plus courante ? », « Les données sont-elles symétriques ? » ou « Y a-t-il des valeurs aberrantes ? ».

Personnalisation de l'histogramme

Par défaut, histplot trace des barres et compte le nombre d'occurrences. Cependant, il est possible de le personnaliser pour obtenir plus d'informations.

1. Modification de la statistique (stat)

Au lieu d'un simple comptage, il est possible de calculer la densité. Cela est utile lors de la comparaison de groupes de tailles différentes, car cela normalise l'aire sous la courbe à 1.

stat='density'

2. Style visuel (element)

Lors de la représentation de plusieurs groupes avec hue, les barres standard peuvent devenir encombrées. L'utilisation d'un tracé en escalier crée un contour, ce qui facilite la visualisation des superpositions.

element='step'

3. Largeur des intervalles (binwidth)

La taille des intervalles détermine le niveau de détail affiché.

binwidth=1

Exemple : Voici comment combiner ces paramètres pour créer un histogramme de densité avec un contour en escalier :

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Tâche

Swipe to start coding

Créer une visualisation claire des longueurs de bec des manchots :

  1. Initialiser un histplot en utilisant le dataframe df.
  2. Définir x sur 'bill_length_mm'.
  3. Grouper les données par 'island' à l'aide du paramètre hue.
  4. Modifier le style visuel en 'step' avec le paramètre element.
  5. Changer l'axe Y pour représenter la 'density' à l'aide du paramètre stat.
  6. Définir la largeur des intervalles (binwidth) à 1 et utiliser la palette 'flare'.
  7. Afficher le graphique.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 4
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookVisualisation des Histogrammes

Glissez pour afficher le menu

Le histplot (diagramme en histogramme) est un outil classique qui représente la distribution d'une ou plusieurs variables en comptant le nombre d'observations qui se trouvent dans des intervalles discrets. Il permet de répondre à des questions telles que : « Quelle est la valeur la plus courante ? », « Les données sont-elles symétriques ? » ou « Y a-t-il des valeurs aberrantes ? ».

Personnalisation de l'histogramme

Par défaut, histplot trace des barres et compte le nombre d'occurrences. Cependant, il est possible de le personnaliser pour obtenir plus d'informations.

1. Modification de la statistique (stat)

Au lieu d'un simple comptage, il est possible de calculer la densité. Cela est utile lors de la comparaison de groupes de tailles différentes, car cela normalise l'aire sous la courbe à 1.

stat='density'

2. Style visuel (element)

Lors de la représentation de plusieurs groupes avec hue, les barres standard peuvent devenir encombrées. L'utilisation d'un tracé en escalier crée un contour, ce qui facilite la visualisation des superpositions.

element='step'

3. Largeur des intervalles (binwidth)

La taille des intervalles détermine le niveau de détail affiché.

binwidth=1

Exemple : Voici comment combiner ces paramètres pour créer un histogramme de densité avec un contour en escalier :

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Loading dataset data = sns.load_dataset('penguins') # Creating a customized histplot sns.histplot( data=data, x='bill_length_mm', hue='species', # Color by species element='step', # Use step lines instead of bars stat='density', # Show density instead of count common_norm=False # Normalize each group separately ) plt.show()
copy
Tâche

Swipe to start coding

Créer une visualisation claire des longueurs de bec des manchots :

  1. Initialiser un histplot en utilisant le dataframe df.
  2. Définir x sur 'bill_length_mm'.
  3. Grouper les données par 'island' à l'aide du paramètre hue.
  4. Modifier le style visuel en 'step' avec le paramètre element.
  5. Changer l'axe Y pour représenter la 'density' à l'aide du paramètre stat.
  6. Définir la largeur des intervalles (binwidth) à 1 et utiliser la palette 'flare'.
  7. Afficher le graphique.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 4
single

single

some-alt