Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Tracer des Distributions Cumulées | Section
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Visualisation Statistique Avec Seaborn

bookTracer des Distributions Cumulées

Un ecdfplot représente la proportion ou le nombre d'observations inférieures à chaque valeur unique dans un ensemble de données.

Comparé à un histogramme ou à une courbe de densité, il présente un avantage majeur : chaque observation est visualisée directement. Cela signifie qu'il n'y a pas de regroupements à ajuster ni de paramètres de lissage susceptibles de déformer les données. Il est souvent considéré comme la méthode la plus « honnête » pour visualiser une distribution.

Paramètres clés

Par défaut, le graphique affiche la proportion (de 0 à 1) de données inférieures à X. Ce comportement peut être modifié :

  • stat='count' : au lieu d'un pourcentage, l'axe Y affiche le nombre d'observations ;
  • complementary=True : inverse la logique. Au lieu d'afficher les valeurs inférieures au seuil, il affiche les valeurs supérieures. Il s'agit essentiellement d'une « courbe de survie » (par exemple, « Combien de manchots ont un bec plus long que 50 mm ? »).

Exemple

Voici comment complementary modifie la visualisation. La courbe descend au lieu de monter.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tâche

Swipe to start coding

Analyser les longueurs de bec des manchots afin de déterminer combien d'entre eux dépassent une certaine longueur.

  1. Importation de pandas, seaborn et matplotlib.pyplot.
  2. Lecture du jeu de données des manchots.
  3. Création d'un graphique ECDF :
  • Définir x sur 'bill_length_mm'.
  • Regrouper par 'island' à l'aide de hue.
  • Activer le mode « survival » en définissant complementary=True.
  • Afficher les nombres absolus en définissant stat='count'.
  • Utiliser la palette 'mako'.
  • Utiliser la variable df comme source de données.
  1. Affichage du graphique.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 7
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

bookTracer des Distributions Cumulées

Glissez pour afficher le menu

Un ecdfplot représente la proportion ou le nombre d'observations inférieures à chaque valeur unique dans un ensemble de données.

Comparé à un histogramme ou à une courbe de densité, il présente un avantage majeur : chaque observation est visualisée directement. Cela signifie qu'il n'y a pas de regroupements à ajuster ni de paramètres de lissage susceptibles de déformer les données. Il est souvent considéré comme la méthode la plus « honnête » pour visualiser une distribution.

Paramètres clés

Par défaut, le graphique affiche la proportion (de 0 à 1) de données inférieures à X. Ce comportement peut être modifié :

  • stat='count' : au lieu d'un pourcentage, l'axe Y affiche le nombre d'observations ;
  • complementary=True : inverse la logique. Au lieu d'afficher les valeurs inférieures au seuil, il affiche les valeurs supérieures. Il s'agit essentiellement d'une « courbe de survie » (par exemple, « Combien de manchots ont un bec plus long que 50 mm ? »).

Exemple

Voici comment complementary modifie la visualisation. La courbe descend au lieu de monter.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tâche

Swipe to start coding

Analyser les longueurs de bec des manchots afin de déterminer combien d'entre eux dépassent une certaine longueur.

  1. Importation de pandas, seaborn et matplotlib.pyplot.
  2. Lecture du jeu de données des manchots.
  3. Création d'un graphique ECDF :
  • Définir x sur 'bill_length_mm'.
  • Regrouper par 'island' à l'aide de hue.
  • Activer le mode « survival » en définissant complementary=True.
  • Afficher les nombres absolus en définissant stat='count'.
  • Utiliser la palette 'mako'.
  • Utiliser la variable df comme source de données.
  1. Affichage du graphique.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 7
single

single

some-alt