Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Plotning af Kumulative Fordelinger | Sektion
Statistisk Visualisering med Seaborn

bookPlotning af Kumulative Fordelinger

En ecdfplot repræsenterer andelen eller antallet af observationer, der falder under hver unik værdi i et datasæt.

Sammenlignet med et histogram eller et tæthedsplot har den en væsentlig fordel: hver observation visualiseres direkte. Det betyder, at der ikke er nogen bin-inddeling, der skal justeres, og ingen udjævningsparametre, der kan forvride dataene. Det anses ofte for at være den mest "ærlige" måde at visualisere en fordeling på.

Centrale parametre

Som standard viser plottet andelen (0 til 1) af data, der er mindre end X. Du kan ændre denne opførsel:

  • stat='count': i stedet for en procentdel viser Y-aksen antallet af observationer;
  • complementary=True: vender logikken om. I stedet for at vise værdier under tærsklen, vises værdier over den. Dette svarer til en "overlevelseskurve" (f.eks. "Hvor mange pingviner har et næb, der er længere end 50 mm?").

Eksempel

Her ses, hvordan complementary ændrer visualiseringen. Kurven går nedad i stedet for opad.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Opgave

Swipe to start coding

Analyser næblængderne hos pingviner for at se, hvor mange af dem der overstiger en bestemt længde.

  1. Importér pandas, seaborn og matplotlib.pyplot.
  2. Indlæs pingvindatasættet.
  3. Opret et ECDF-plot:
  • Sæt x til 'bill_length_mm'.
  • Gruppér efter 'island' ved hjælp af hue.
    • Aktivér "survival"-tilstand ved at sætte complementary=True.
  • Vis absolutte tal ved at sætte stat='count'.
  • Brug paletten 'mako'.
  • Brug variablen df som data.
  1. Vis plottet.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 7
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

bookPlotning af Kumulative Fordelinger

Stryg for at vise menuen

En ecdfplot repræsenterer andelen eller antallet af observationer, der falder under hver unik værdi i et datasæt.

Sammenlignet med et histogram eller et tæthedsplot har den en væsentlig fordel: hver observation visualiseres direkte. Det betyder, at der ikke er nogen bin-inddeling, der skal justeres, og ingen udjævningsparametre, der kan forvride dataene. Det anses ofte for at være den mest "ærlige" måde at visualisere en fordeling på.

Centrale parametre

Som standard viser plottet andelen (0 til 1) af data, der er mindre end X. Du kan ændre denne opførsel:

  • stat='count': i stedet for en procentdel viser Y-aksen antallet af observationer;
  • complementary=True: vender logikken om. I stedet for at vise værdier under tærsklen, vises værdier over den. Dette svarer til en "overlevelseskurve" (f.eks. "Hvor mange pingviner har et næb, der er længere end 50 mm?").

Eksempel

Her ses, hvordan complementary ændrer visualiseringen. Kurven går nedad i stedet for opad.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Opgave

Swipe to start coding

Analyser næblængderne hos pingviner for at se, hvor mange af dem der overstiger en bestemt længde.

  1. Importér pandas, seaborn og matplotlib.pyplot.
  2. Indlæs pingvindatasættet.
  3. Opret et ECDF-plot:
  • Sæt x til 'bill_length_mm'.
  • Gruppér efter 'island' ved hjælp af hue.
    • Aktivér "survival"-tilstand ved at sætte complementary=True.
  • Vis absolutte tal ved at sætte stat='count'.
  • Brug paletten 'mako'.
  • Brug variablen df som data.
  1. Vis plottet.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 7
single

single

some-alt