Kumulatiivisten Jakaumien Piirtäminen
ecdfplot kuvaa osuuden tai määrän havainnoista, jotka ovat pienempiä kuin kukin yksilöllinen arvo aineistossa.
Verrattuna histogrammiin tai tiheyskäyrään sillä on merkittävä etu: jokainen havainto esitetään suoraan. Tämä tarkoittaa, ettei ole jaottelua (binsejä) tai tasoitusparametreja, jotka voisivat vääristää dataa. Sitä pidetään usein "rehellisimpänä" tapana visualisoida jakauma.
Keskeiset parametrit
Oletuksena kuvaaja näyttää osuuden (0–1) datasta, joka on pienempi kuin X. Voit muuttaa tätä toimintaa:
stat='count': prosenttiosuuden sijaan Y-akseli näyttää havaintojen määrän;complementary=True: kääntää logiikan. Sen sijaan, että näytettäisiin arvot alle kynnyksen, näytetään arvot yli sen. Tämä on käytännössä "selviytymiskäyrä" (esim. "Kuinka monella pingviinillä on nokka pidempi kuin 50 mm?").
Esimerkki
Näin complementary muuttaa visualisointia. Käyrä laskee ylöspäin nousemisen sijaan.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analysoi pingviinien nokkien pituuksia selvittääksesi, kuinka monella niistä pituus ylittää tietyn arvon.
- Tuo kirjastot
pandas,seabornjamatplotlib.pyplot. - Lue penguins-aineisto.
- Luo ECDF-kuvaaja:
- Aseta
xarvoksi'bill_length_mm'.- Ryhmittele
'island'-sarakkeen mukaan käyttämällähue-parametria. - Ota käyttöön "survival"-tila asettamalla
complementary=True.
- Ryhmittele
- Näytä absoluuttiset lukumäärät asettamalla
stat='count'.- Käytä
'mako'-väripalettia. - Käytä
df-muuttujaa datana.
- Käytä
- Näytä kuvaaja.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 4.55
Kumulatiivisten Jakaumien Piirtäminen
Pyyhkäise näyttääksesi valikon
ecdfplot kuvaa osuuden tai määrän havainnoista, jotka ovat pienempiä kuin kukin yksilöllinen arvo aineistossa.
Verrattuna histogrammiin tai tiheyskäyrään sillä on merkittävä etu: jokainen havainto esitetään suoraan. Tämä tarkoittaa, ettei ole jaottelua (binsejä) tai tasoitusparametreja, jotka voisivat vääristää dataa. Sitä pidetään usein "rehellisimpänä" tapana visualisoida jakauma.
Keskeiset parametrit
Oletuksena kuvaaja näyttää osuuden (0–1) datasta, joka on pienempi kuin X. Voit muuttaa tätä toimintaa:
stat='count': prosenttiosuuden sijaan Y-akseli näyttää havaintojen määrän;complementary=True: kääntää logiikan. Sen sijaan, että näytettäisiin arvot alle kynnyksen, näytetään arvot yli sen. Tämä on käytännössä "selviytymiskäyrä" (esim. "Kuinka monella pingviinillä on nokka pidempi kuin 50 mm?").
Esimerkki
Näin complementary muuttaa visualisointia. Käyrä laskee ylöspäin nousemisen sijaan.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analysoi pingviinien nokkien pituuksia selvittääksesi, kuinka monella niistä pituus ylittää tietyn arvon.
- Tuo kirjastot
pandas,seabornjamatplotlib.pyplot. - Lue penguins-aineisto.
- Luo ECDF-kuvaaja:
- Aseta
xarvoksi'bill_length_mm'.- Ryhmittele
'island'-sarakkeen mukaan käyttämällähue-parametria. - Ota käyttöön "survival"-tila asettamalla
complementary=True.
- Ryhmittele
- Näytä absoluuttiset lukumäärät asettamalla
stat='count'.- Käytä
'mako'-väripalettia. - Käytä
df-muuttujaa datana.
- Käytä
- Näytä kuvaaja.
Ratkaisu
Kiitos palautteestasi!
single