Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Plottning av Kumulativa Fördelningar | Sektion
Statistisk Visualisering med Seaborn

bookPlottning av Kumulativa Fördelningar

En ecdfplot representerar andelen eller antalet observationer som faller under varje unikt värde i en datamängd.

Jämfört med ett histogram eller en täthetsplot har den en betydande fördel: varje observation visualiseras direkt. Det innebär att det inte finns några binar att justera och inga utjämningsparametrar som kan förvränga datan. Det anses ofta vara det mest "ärliga" sättet att visualisera en fördelning.

Viktiga parametrar

Som standard visar plottet andelen (0 till 1) av data som är mindre än X. Du kan ändra detta beteende:

  • stat='count': istället för en procentandel visar Y-axeln antalet observationer;
  • complementary=True: vänder logiken. Istället för att visa värden under tröskeln, visar den värden över den. Detta är i princip en "överlevnadskurva" (t.ex. "Hur många pingviner har en näbb som är längre än 50 mm?").

Exempel

Så här förändrar complementary visualiseringen. Kurvan går nedåt istället för uppåt.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Uppgift

Swipe to start coding

Analysera näbbens längd hos pingviner för att se hur många som överstiger en viss längd.

  1. Importera pandas, seaborn och matplotlib.pyplot.
  2. Läs in pingvindatasetet.
  3. Skapa ett ECDF-diagram:
  • Ange x till 'bill_length_mm'.
  • Gruppera efter 'island' med hjälp av hue.
    • Aktivera "survival"-läget genom att sätta complementary=True.
  • Visa absoluta tal genom att sätta stat='count'.
  • Använd paletten 'mako'.
  • Använd variabeln df som data.
  1. Visa diagrammet.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 7
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

bookPlottning av Kumulativa Fördelningar

Svep för att visa menyn

En ecdfplot representerar andelen eller antalet observationer som faller under varje unikt värde i en datamängd.

Jämfört med ett histogram eller en täthetsplot har den en betydande fördel: varje observation visualiseras direkt. Det innebär att det inte finns några binar att justera och inga utjämningsparametrar som kan förvränga datan. Det anses ofta vara det mest "ärliga" sättet att visualisera en fördelning.

Viktiga parametrar

Som standard visar plottet andelen (0 till 1) av data som är mindre än X. Du kan ändra detta beteende:

  • stat='count': istället för en procentandel visar Y-axeln antalet observationer;
  • complementary=True: vänder logiken. Istället för att visa värden under tröskeln, visar den värden över den. Detta är i princip en "överlevnadskurva" (t.ex. "Hur många pingviner har en näbb som är längre än 50 mm?").

Exempel

Så här förändrar complementary visualiseringen. Kurvan går nedåt istället för uppåt.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Uppgift

Swipe to start coding

Analysera näbbens längd hos pingviner för att se hur många som överstiger en viss längd.

  1. Importera pandas, seaborn och matplotlib.pyplot.
  2. Läs in pingvindatasetet.
  3. Skapa ett ECDF-diagram:
  • Ange x till 'bill_length_mm'.
  • Gruppera efter 'island' med hjälp av hue.
    • Aktivera "survival"-läget genom att sätta complementary=True.
  • Visa absoluta tal genom att sätta stat='count'.
  • Använd paletten 'mako'.
  • Använd variabeln df som data.
  1. Visa diagrammet.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 7
single

single

some-alt