Plottning av Kumulativa Fördelningar
En ecdfplot representerar andelen eller antalet observationer som faller under varje unikt värde i en datamängd.
Jämfört med ett histogram eller en täthetsplot har den en betydande fördel: varje observation visualiseras direkt. Det innebär att det inte finns några binar att justera och inga utjämningsparametrar som kan förvränga datan. Det anses ofta vara det mest "ärliga" sättet att visualisera en fördelning.
Viktiga parametrar
Som standard visar plottet andelen (0 till 1) av data som är mindre än X. Du kan ändra detta beteende:
stat='count': istället för en procentandel visar Y-axeln antalet observationer;complementary=True: vänder logiken. Istället för att visa värden under tröskeln, visar den värden över den. Detta är i princip en "överlevnadskurva" (t.ex. "Hur många pingviner har en näbb som är längre än 50 mm?").
Exempel
Så här förändrar complementary visualiseringen. Kurvan går nedåt istället för uppåt.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analysera näbbens längd hos pingviner för att se hur många som överstiger en viss längd.
- Importera
pandas,seabornochmatplotlib.pyplot. - Läs in pingvindatasetet.
- Skapa ett ECDF-diagram:
- Ange
xtill'bill_length_mm'. - Gruppera efter
'island'med hjälp avhue.- Aktivera "survival"-läget genom att sätta
complementary=True.
- Aktivera "survival"-läget genom att sätta
- Visa absoluta tal genom att sätta
stat='count'. - Använd paletten
'mako'. - Använd variabeln
dfsom data.
- Visa diagrammet.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Fantastiskt!
Completion betyg förbättrat till 4.55
Plottning av Kumulativa Fördelningar
Svep för att visa menyn
En ecdfplot representerar andelen eller antalet observationer som faller under varje unikt värde i en datamängd.
Jämfört med ett histogram eller en täthetsplot har den en betydande fördel: varje observation visualiseras direkt. Det innebär att det inte finns några binar att justera och inga utjämningsparametrar som kan förvränga datan. Det anses ofta vara det mest "ärliga" sättet att visualisera en fördelning.
Viktiga parametrar
Som standard visar plottet andelen (0 till 1) av data som är mindre än X. Du kan ändra detta beteende:
stat='count': istället för en procentandel visar Y-axeln antalet observationer;complementary=True: vänder logiken. Istället för att visa värden under tröskeln, visar den värden över den. Detta är i princip en "överlevnadskurva" (t.ex. "Hur många pingviner har en näbb som är längre än 50 mm?").
Exempel
Så här förändrar complementary visualiseringen. Kurvan går nedåt istället för uppåt.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analysera näbbens längd hos pingviner för att se hur många som överstiger en viss längd.
- Importera
pandas,seabornochmatplotlib.pyplot. - Läs in pingvindatasetet.
- Skapa ett ECDF-diagram:
- Ange
xtill'bill_length_mm'. - Gruppera efter
'island'med hjälp avhue.- Aktivera "survival"-läget genom att sätta
complementary=True.
- Aktivera "survival"-läget genom att sätta
- Visa absoluta tal genom att sätta
stat='count'. - Använd paletten
'mako'. - Använd variabeln
dfsom data.
- Visa diagrammet.
Lösning
Tack för dina kommentarer!
single