Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Cumulatieve Verdelingen Plotten | Sectie
Practice
Projects
Quizzes & Challenges
Quizzen
Challenges
/
Statistische Visualisatie Met Seaborn

bookCumulatieve Verdelingen Plotten

Een ecdfplot geeft het aandeel of het aantal waarnemingen weer dat onder elke unieke waarde in een dataset valt.

In vergelijking met een histogram of dichtheidsplot heeft het een belangrijk voordeel: elke waarneming wordt direct gevisualiseerd. Dit betekent dat er geen bins zijn om aan te passen en geen gladmakingsparameters die de data kunnen vertekenen. Het wordt vaak beschouwd als de meest "eerlijke" manier om een verdeling te visualiseren.

Belangrijke parameters

Standaard toont de plot het aandeel (0 tot 1) van data kleiner dan X. Je kunt dit gedrag aanpassen:

  • stat='count': in plaats van een percentage toont de Y-as het aantal waarnemingen;
  • complementary=True: keert de logica om. In plaats van waarden onder de drempel te tonen, worden waarden boven de drempel weergegeven. Dit is in wezen een "overlevingscurve" (bijvoorbeeld: "Hoeveel pinguïns hebben een snavel die langer is dan 50mm?").

Voorbeeld

Hier zie je hoe complementary de visualisatie verandert. De curve daalt in plaats van te stijgen.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Taak

Swipe to start coding

Analyseer de snavellengtes van pinguïns om te bepalen hoeveel daarvan een bepaalde lengte overschrijden.

  1. Importeer pandas, seaborn en matplotlib.pyplot.
  2. Lees de penguins dataset in.
  3. Maak een ECDF-plot:
  • Stel x in op 'bill_length_mm'.
  • Groepeer op 'island' met behulp van hue.
    • Schakel de "survival"-modus in door complementary=True te zetten.
  • Toon absolute aantallen door stat='count' te gebruiken.
    • Gebruik het 'mako'-palet.
  • Gebruik de variabele df als data.
  1. Toon de plot.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 7
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

bookCumulatieve Verdelingen Plotten

Veeg om het menu te tonen

Een ecdfplot geeft het aandeel of het aantal waarnemingen weer dat onder elke unieke waarde in een dataset valt.

In vergelijking met een histogram of dichtheidsplot heeft het een belangrijk voordeel: elke waarneming wordt direct gevisualiseerd. Dit betekent dat er geen bins zijn om aan te passen en geen gladmakingsparameters die de data kunnen vertekenen. Het wordt vaak beschouwd als de meest "eerlijke" manier om een verdeling te visualiseren.

Belangrijke parameters

Standaard toont de plot het aandeel (0 tot 1) van data kleiner dan X. Je kunt dit gedrag aanpassen:

  • stat='count': in plaats van een percentage toont de Y-as het aantal waarnemingen;
  • complementary=True: keert de logica om. In plaats van waarden onder de drempel te tonen, worden waarden boven de drempel weergegeven. Dit is in wezen een "overlevingscurve" (bijvoorbeeld: "Hoeveel pinguïns hebben een snavel die langer is dan 50mm?").

Voorbeeld

Hier zie je hoe complementary de visualisatie verandert. De curve daalt in plaats van te stijgen.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Taak

Swipe to start coding

Analyseer de snavellengtes van pinguïns om te bepalen hoeveel daarvan een bepaalde lengte overschrijden.

  1. Importeer pandas, seaborn en matplotlib.pyplot.
  2. Lees de penguins dataset in.
  3. Maak een ECDF-plot:
  • Stel x in op 'bill_length_mm'.
  • Groepeer op 'island' met behulp van hue.
    • Schakel de "survival"-modus in door complementary=True te zetten.
  • Toon absolute aantallen door stat='count' te gebruiken.
    • Gebruik het 'mako'-palet.
  • Gebruik de variabele df als data.
  1. Toon de plot.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 7
single

single

some-alt