Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Kumulatiivisten Jakaumien Piirtäminen | Osio
Tilastollinen Visualisointi Seabornilla

bookKumulatiivisten Jakaumien Piirtäminen

ecdfplot kuvaa osuuden tai määrän havainnoista, jotka ovat pienempiä kuin kukin yksilöllinen arvo aineistossa.

Verrattuna histogrammiin tai tiheyskäyrään sillä on merkittävä etu: jokainen havainto esitetään suoraan. Tämä tarkoittaa, ettei ole jaottelua (binsejä) tai tasoitusparametreja, jotka voisivat vääristää dataa. Sitä pidetään usein "rehellisimpänä" tapana visualisoida jakauma.

Keskeiset parametrit

Oletuksena kuvaaja näyttää osuuden (0–1) datasta, joka on pienempi kuin X. Voit muuttaa tätä toimintaa:

  • stat='count': prosenttiosuuden sijaan Y-akseli näyttää havaintojen määrän;
  • complementary=True: kääntää logiikan. Sen sijaan, että näytettäisiin arvot alle kynnyksen, näytetään arvot yli sen. Tämä on käytännössä "selviytymiskäyrä" (esim. "Kuinka monella pingviinillä on nokka pidempi kuin 50 mm?").

Esimerkki

Näin complementary muuttaa visualisointia. Käyrä laskee ylöspäin nousemisen sijaan.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tehtävä

Swipe to start coding

Analysoi pingviinien nokkien pituuksia selvittääksesi, kuinka monella niistä pituus ylittää tietyn arvon.

  1. Tuo kirjastot pandas, seaborn ja matplotlib.pyplot.
  2. Lue penguins-aineisto.
  3. Luo ECDF-kuvaaja:
  • Aseta x arvoksi 'bill_length_mm'.
    • Ryhmittele 'island'-sarakkeen mukaan käyttämällä hue-parametria.
    • Ota käyttöön "survival"-tila asettamalla complementary=True.
  • Näytä absoluuttiset lukumäärät asettamalla stat='count'.
    • Käytä 'mako'-väripalettia.
    • Käytä df-muuttujaa datana.
  1. Näytä kuvaaja.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

bookKumulatiivisten Jakaumien Piirtäminen

Pyyhkäise näyttääksesi valikon

ecdfplot kuvaa osuuden tai määrän havainnoista, jotka ovat pienempiä kuin kukin yksilöllinen arvo aineistossa.

Verrattuna histogrammiin tai tiheyskäyrään sillä on merkittävä etu: jokainen havainto esitetään suoraan. Tämä tarkoittaa, ettei ole jaottelua (binsejä) tai tasoitusparametreja, jotka voisivat vääristää dataa. Sitä pidetään usein "rehellisimpänä" tapana visualisoida jakauma.

Keskeiset parametrit

Oletuksena kuvaaja näyttää osuuden (0–1) datasta, joka on pienempi kuin X. Voit muuttaa tätä toimintaa:

  • stat='count': prosenttiosuuden sijaan Y-akseli näyttää havaintojen määrän;
  • complementary=True: kääntää logiikan. Sen sijaan, että näytettäisiin arvot alle kynnyksen, näytetään arvot yli sen. Tämä on käytännössä "selviytymiskäyrä" (esim. "Kuinka monella pingviinillä on nokka pidempi kuin 50 mm?").

Esimerkki

Näin complementary muuttaa visualisointia. Käyrä laskee ylöspäin nousemisen sijaan.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tehtävä

Swipe to start coding

Analysoi pingviinien nokkien pituuksia selvittääksesi, kuinka monella niistä pituus ylittää tietyn arvon.

  1. Tuo kirjastot pandas, seaborn ja matplotlib.pyplot.
  2. Lue penguins-aineisto.
  3. Luo ECDF-kuvaaja:
  • Aseta x arvoksi 'bill_length_mm'.
    • Ryhmittele 'island'-sarakkeen mukaan käyttämällä hue-parametria.
    • Ota käyttöön "survival"-tila asettamalla complementary=True.
  • Näytä absoluuttiset lukumäärät asettamalla stat='count'.
    • Käytä 'mako'-väripalettia.
    • Käytä df-muuttujaa datana.
  1. Näytä kuvaaja.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7
single

single

some-alt