Cumulatieve Verdelingen Plotten
Een ecdfplot geeft het aandeel of het aantal waarnemingen weer dat onder elke unieke waarde in een dataset valt.
In vergelijking met een histogram of dichtheidsplot heeft het een belangrijk voordeel: elke waarneming wordt direct gevisualiseerd. Dit betekent dat er geen bins zijn om aan te passen en geen gladmakingsparameters die de data kunnen vertekenen. Het wordt vaak beschouwd als de meest "eerlijke" manier om een verdeling te visualiseren.
Belangrijke parameters
Standaard toont de plot het aandeel (0 tot 1) van data kleiner dan X. Je kunt dit gedrag aanpassen:
stat='count': in plaats van een percentage toont de Y-as het aantal waarnemingen;complementary=True: keert de logica om. In plaats van waarden onder de drempel te tonen, worden waarden boven de drempel weergegeven. Dit is in wezen een "overlevingscurve" (bijvoorbeeld: "Hoeveel pinguïns hebben een snavel die langer is dan 50mm?").
Voorbeeld
Hier zie je hoe complementary de visualisatie verandert. De curve daalt in plaats van te stijgen.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analyseer de snavellengtes van pinguïns om te bepalen hoeveel daarvan een bepaalde lengte overschrijden.
- Importeer
pandas,seabornenmatplotlib.pyplot. - Lees de penguins dataset in.
- Maak een ECDF-plot:
- Stel
xin op'bill_length_mm'. - Groepeer op
'island'met behulp vanhue.- Schakel de "survival"-modus in door
complementary=Truete zetten.
- Schakel de "survival"-modus in door
- Toon absolute aantallen door
stat='count'te gebruiken.- Gebruik het
'mako'-palet.
- Gebruik het
- Gebruik de variabele
dfals data.
- Toon de plot.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 4.55
Cumulatieve Verdelingen Plotten
Veeg om het menu te tonen
Een ecdfplot geeft het aandeel of het aantal waarnemingen weer dat onder elke unieke waarde in een dataset valt.
In vergelijking met een histogram of dichtheidsplot heeft het een belangrijk voordeel: elke waarneming wordt direct gevisualiseerd. Dit betekent dat er geen bins zijn om aan te passen en geen gladmakingsparameters die de data kunnen vertekenen. Het wordt vaak beschouwd als de meest "eerlijke" manier om een verdeling te visualiseren.
Belangrijke parameters
Standaard toont de plot het aandeel (0 tot 1) van data kleiner dan X. Je kunt dit gedrag aanpassen:
stat='count': in plaats van een percentage toont de Y-as het aantal waarnemingen;complementary=True: keert de logica om. In plaats van waarden onder de drempel te tonen, worden waarden boven de drempel weergegeven. Dit is in wezen een "overlevingscurve" (bijvoorbeeld: "Hoeveel pinguïns hebben een snavel die langer is dan 50mm?").
Voorbeeld
Hier zie je hoe complementary de visualisatie verandert. De curve daalt in plaats van te stijgen.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analyseer de snavellengtes van pinguïns om te bepalen hoeveel daarvan een bepaalde lengte overschrijden.
- Importeer
pandas,seabornenmatplotlib.pyplot. - Lees de penguins dataset in.
- Maak een ECDF-plot:
- Stel
xin op'bill_length_mm'. - Groepeer op
'island'met behulp vanhue.- Schakel de "survival"-modus in door
complementary=Truete zetten.
- Schakel de "survival"-modus in door
- Toon absolute aantallen door
stat='count'te gebruiken.- Gebruik het
'mako'-palet.
- Gebruik het
- Gebruik de variabele
dfals data.
- Toon de plot.
Oplossing
Bedankt voor je feedback!
single