Tracer des Distributions Cumulées
Un ecdfplot représente la proportion ou le nombre d'observations inférieures à chaque valeur unique dans un ensemble de données.
Comparé à un histogramme ou à une courbe de densité, il présente un avantage majeur : chaque observation est visualisée directement. Cela signifie qu'il n'y a pas de regroupements à ajuster ni de paramètres de lissage susceptibles de déformer les données. Il est souvent considéré comme la méthode la plus « honnête » pour visualiser une distribution.
Paramètres clés
Par défaut, le graphique affiche la proportion (de 0 à 1) de données inférieures à X. Ce comportement peut être modifié :
stat='count': au lieu d'un pourcentage, l'axe Y affiche le nombre d'observations ;complementary=True: inverse la logique. Au lieu d'afficher les valeurs inférieures au seuil, il affiche les valeurs supérieures. Il s'agit essentiellement d'une « courbe de survie » (par exemple, « Combien de manchots ont un bec plus long que 50 mm ? »).
Exemple
Voici comment complementary modifie la visualisation. La courbe descend au lieu de monter.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analyser les longueurs de bec des manchots afin de déterminer combien d'entre eux dépassent une certaine longueur.
- Importation de
pandas,seabornetmatplotlib.pyplot. - Lecture du jeu de données des manchots.
- Création d'un graphique ECDF :
- Définir
xsur'bill_length_mm'. - Regrouper par
'island'à l'aide dehue. - Activer le mode « survival » en définissant
complementary=True. - Afficher les nombres absolus en définissant
stat='count'. - Utiliser la palette
'mako'. - Utiliser la variable
dfcomme source de données.
- Affichage du graphique.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 4.55
Tracer des Distributions Cumulées
Glissez pour afficher le menu
Un ecdfplot représente la proportion ou le nombre d'observations inférieures à chaque valeur unique dans un ensemble de données.
Comparé à un histogramme ou à une courbe de densité, il présente un avantage majeur : chaque observation est visualisée directement. Cela signifie qu'il n'y a pas de regroupements à ajuster ni de paramètres de lissage susceptibles de déformer les données. Il est souvent considéré comme la méthode la plus « honnête » pour visualiser une distribution.
Paramètres clés
Par défaut, le graphique affiche la proportion (de 0 à 1) de données inférieures à X. Ce comportement peut être modifié :
stat='count': au lieu d'un pourcentage, l'axe Y affiche le nombre d'observations ;complementary=True: inverse la logique. Au lieu d'afficher les valeurs inférieures au seuil, il affiche les valeurs supérieures. Il s'agit essentiellement d'une « courbe de survie » (par exemple, « Combien de manchots ont un bec plus long que 50 mm ? »).
Exemple
Voici comment complementary modifie la visualisation. La courbe descend au lieu de monter.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analyser les longueurs de bec des manchots afin de déterminer combien d'entre eux dépassent une certaine longueur.
- Importation de
pandas,seabornetmatplotlib.pyplot. - Lecture du jeu de données des manchots.
- Création d'un graphique ECDF :
- Définir
xsur'bill_length_mm'. - Regrouper par
'island'à l'aide dehue. - Activer le mode « survival » en définissant
complementary=True. - Afficher les nombres absolus en définissant
stat='count'. - Utiliser la palette
'mako'. - Utiliser la variable
dfcomme source de données.
- Affichage du graphique.
Solution
Merci pour vos commentaires !
single