KDE-Kuvaaja
Kernel Density Estimation (KDE) -käyrä on kuvaajatyyppi, joka havainnollistaa jatkuvan muuttujan arvioitua todennäköisyystiheysfunktiota. Toisin kuin histogrammi, joka esittää tiedot diskreeteillä palkkikaavioilla jaettuna väleihin, KDE-käyrä esittää jakauman tasaisena, jatkuvana käyränä, joka perustuu kaikkiin havaintopisteisiin.
Tässä esimerkissä histogrammi yhdistetään KDE-käyrään (oranssi käyrä), mikä antaa selkeämmän arvion todennäköisyystiheysfunktiosta kuin pelkkä histogrammi.
Kirjastossa seaborn
funktio kdeplot()
mahdollistaa KDE-kuvaajien helpon luomisen. Sen keskeiset parametrit—data
, x
ja y
—toimivat samalla tavalla kuin countplot()
-funktiossa.
Ensimmäinen vaihtoehto
Vain yksi parametri voidaan asettaa välittämällä arvojono, jolloin jokainen elementti voidaan mukauttaa erikseen.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting only the data parameter sns.kdeplot(data=weather_df['Seattle'], fill=True) plt.show()
data
-parametri asetetaan välittämällä Series-olio, ja fill
-parametrilla täytetään käyrän alapuolinen alue, joka oletuksena jää täyttämättä.
Toinen vaihtoehto
On myös mahdollista asettaa 2D-olio kuten DataFrame data
-parametriksi ja sarakkeen nimi tai avain, jos data
on sanakirja, x
-parametriksi (pystysuora suunta) tai y
-parametriksi (vaakasuora suunta):
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Loading the dataset with the average yearly temperatures in Boston and Seattle url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/weather_data.csv' weather_df = pd.read_csv(url, index_col=0) # Creating a KDE plot setting both the data and x parameters sns.kdeplot(data=weather_df, x='Seattle', fill=True) plt.show()
Samat tulokset saavutettiin antamalla koko DataFrame
data
-parametriksi ja määrittämällä sarakkeen nimi x
-parametriksi.
Luotu KDE-kuvaaja esittää tyypillisen kellokäyrän, joka muistuttaa normaalijakaumaa, jonka keskiarvo on noin 52°F.
Jos haluat tutustua tarkemmin KDE plot -funktioon, voit vapaasti perehtyä kdeplot()
-dokumentaatioon.
Swipe to start coding
- Käytä oikeaa funktiota KDE-kuvaajan luomiseen.
- Käytä
countries_df
-dataa kuvaajan aineistona (ensimmäinen argumentti). - Aseta sarakkeeksi
'GDP per capita'
ja suunta vaakasuoraksi toisen argumentin avulla. - Täytä käyrän alapuolinen alue kolmannen (oikeanpuoleisimman) argumentin avulla.
Ratkaisu
Kiitos palautteestasi!