Plotting av kumulative fordelinger
En ecdfplot viser andelen eller antallet observasjoner som faller under hver unike verdi i et datasett.
Sammenlignet med et histogram eller en tetthetsplot har den en betydelig fordel: hver observasjon visualiseres direkte. Dette betyr at det ikke er noen intervaller som må justeres, og ingen glatteparametere som kan forvrenge dataene. Den anses ofte som den mest "ærlige" måten å visualisere en fordeling på.
Viktige parametere
Som standard viser plottet andelen (0 til 1) av data som er mindre enn X. Du kan endre denne oppførselen:
stat='count': i stedet for en prosentandel, viser Y-aksen antall observasjoner;complementary=True: snur logikken. I stedet for å vise verdier under terskelen, viser den verdier over den. Dette er i hovedsak en "overlevelseskurve" (f.eks. "Hvor mange pingviner har et nebb som er lengre enn 50 mm?").
Eksempel
Slik endrer complementary visualiseringen. Kurven går nedover i stedet for oppover.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analyser nebbelengden til pingviner for å se hvor mange som overstiger en viss lengde.
- Importer
pandas,seabornogmatplotlib.pyplot. - Les inn datasettet med pingviner.
- Lag et ECDF-diagram:
- Sett
xtil'bill_length_mm'. - Grupper etter
'island'ved å brukehue.- Aktiver "survival"-modus ved å sette
complementary=True.
- Aktiver "survival"-modus ved å sette
- Vis absolutte tall ved å sette
stat='count'. - Bruk paletten
'mako'. - Bruk variabelen
dfsom data.
- Vis diagrammet.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 4.55
Plotting av kumulative fordelinger
Sveip for å vise menyen
En ecdfplot viser andelen eller antallet observasjoner som faller under hver unike verdi i et datasett.
Sammenlignet med et histogram eller en tetthetsplot har den en betydelig fordel: hver observasjon visualiseres direkte. Dette betyr at det ikke er noen intervaller som må justeres, og ingen glatteparametere som kan forvrenge dataene. Den anses ofte som den mest "ærlige" måten å visualisere en fordeling på.
Viktige parametere
Som standard viser plottet andelen (0 til 1) av data som er mindre enn X. Du kan endre denne oppførselen:
stat='count': i stedet for en prosentandel, viser Y-aksen antall observasjoner;complementary=True: snur logikken. I stedet for å vise verdier under terskelen, viser den verdier over den. Dette er i hovedsak en "overlevelseskurve" (f.eks. "Hvor mange pingviner har et nebb som er lengre enn 50 mm?").
Eksempel
Slik endrer complementary visualiseringen. Kurven går nedover i stedet for oppover.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analyser nebbelengden til pingviner for å se hvor mange som overstiger en viss lengde.
- Importer
pandas,seabornogmatplotlib.pyplot. - Les inn datasettet med pingviner.
- Lag et ECDF-diagram:
- Sett
xtil'bill_length_mm'. - Grupper etter
'island'ved å brukehue.- Aktiver "survival"-modus ved å sette
complementary=True.
- Aktiver "survival"-modus ved å sette
- Vis absolutte tall ved å sette
stat='count'. - Bruk paletten
'mako'. - Bruk variabelen
dfsom data.
- Vis diagrammet.
Løsning
Takk for tilbakemeldingene dine!
single