Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Plotting av kumulative fordelinger | Seksjon
Statistisk Visualisering med Seaborn

bookPlotting av kumulative fordelinger

En ecdfplot viser andelen eller antallet observasjoner som faller under hver unike verdi i et datasett.

Sammenlignet med et histogram eller en tetthetsplot har den en betydelig fordel: hver observasjon visualiseres direkte. Dette betyr at det ikke er noen intervaller som må justeres, og ingen glatteparametere som kan forvrenge dataene. Den anses ofte som den mest "ærlige" måten å visualisere en fordeling på.

Viktige parametere

Som standard viser plottet andelen (0 til 1) av data som er mindre enn X. Du kan endre denne oppførselen:

  • stat='count': i stedet for en prosentandel, viser Y-aksen antall observasjoner;
  • complementary=True: snur logikken. I stedet for å vise verdier under terskelen, viser den verdier over den. Dette er i hovedsak en "overlevelseskurve" (f.eks. "Hvor mange pingviner har et nebb som er lengre enn 50 mm?").

Eksempel

Slik endrer complementary visualiseringen. Kurven går nedover i stedet for oppover.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Oppgave

Swipe to start coding

Analyser nebbelengden til pingviner for å se hvor mange som overstiger en viss lengde.

  1. Importer pandas, seaborn og matplotlib.pyplot.
  2. Les inn datasettet med pingviner.
  3. Lag et ECDF-diagram:
  • Sett x til 'bill_length_mm'.
  • Grupper etter 'island' ved å bruke hue.
    • Aktiver "survival"-modus ved å sette complementary=True.
  • Vis absolutte tall ved å sette stat='count'.
  • Bruk paletten 'mako'.
  • Bruk variabelen df som data.
  1. Vis diagrammet.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 7
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

bookPlotting av kumulative fordelinger

Sveip for å vise menyen

En ecdfplot viser andelen eller antallet observasjoner som faller under hver unike verdi i et datasett.

Sammenlignet med et histogram eller en tetthetsplot har den en betydelig fordel: hver observasjon visualiseres direkte. Dette betyr at det ikke er noen intervaller som må justeres, og ingen glatteparametere som kan forvrenge dataene. Den anses ofte som den mest "ærlige" måten å visualisere en fordeling på.

Viktige parametere

Som standard viser plottet andelen (0 til 1) av data som er mindre enn X. Du kan endre denne oppførselen:

  • stat='count': i stedet for en prosentandel, viser Y-aksen antall observasjoner;
  • complementary=True: snur logikken. I stedet for å vise verdier under terskelen, viser den verdier over den. Dette er i hovedsak en "overlevelseskurve" (f.eks. "Hvor mange pingviner har et nebb som er lengre enn 50 mm?").

Eksempel

Slik endrer complementary visualiseringen. Kurven går nedover i stedet for oppover.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Oppgave

Swipe to start coding

Analyser nebbelengden til pingviner for å se hvor mange som overstiger en viss lengde.

  1. Importer pandas, seaborn og matplotlib.pyplot.
  2. Les inn datasettet med pingviner.
  3. Lag et ECDF-diagram:
  • Sett x til 'bill_length_mm'.
  • Grupper etter 'island' ved å bruke hue.
    • Aktiver "survival"-modus ved å sette complementary=True.
  • Vis absolutte tall ved å sette stat='count'.
  • Bruk paletten 'mako'.
  • Bruk variabelen df som data.
  1. Vis diagrammet.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 7
single

single

some-alt