Lukumääräkaavio
Countplot on pylväsdiagrammi, joka muodostaa pylväitä (palkkeja), jotka kuvaavat kunkin kategorian havaintojen määrää kategorisessa listassa. Sitä voidaan pitää myös kategorisen muuttujan histogrammina.
Tässä jokainen pylväs kuvaa Titanicin matkustajien määrää kussakin luokassa. Olet ehkä jo huomannut, että tämä kuvaaja muistuttaa hyvin paljon pylväsdiagrammia. Se onkin tarkemmin ottaen tietynlainen pylväsdiagrammi, joka esittää kunkin kategorian frekvenssin.
Huom
Sinun täytyy edelleen tuoda
pyplot
-moduulimatplotlib
-kirjastosta ja käyttääplt.show()
-funktiota näyttääksesiseaborn
-kirjastolla luodut kuvaajat.
Countplotin luomiseen seaborn
-kirjastolla käytetään countplot()
-funktiota. Tälle funktiolle on useita tapoja välittää dataa.
Yksiulotteisen taulukon välittäminen
Ensimmäinen vaihtoehto on yksinkertaisesti välittää arvo x
-parametrille, joka voi olla jonkinlainen taulukko:
import seaborn as sns import matplotlib.pyplot as plt fruits = ['apple', 'banana', 'orange', 'apple', 'apple', 'apple', 'orange', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana'] sns.countplot(x=fruits) plt.show()
Funktio laskee jokaisen yksilöllisen alkion esiintymismäärän listassa ja luo pylvään vastaavalla korkeudella.
y
-parametria voidaan käyttää x
:n sijasta, jotta kaavion suunta muuttuu pystysuorasta vaakasuoraksi.
2D-objektin välittäminen
Toinen vaihtoehto on käyttää data
-parametria yhdessä x
- tai y
-parametrin kanssa. Tämä lähestymistapa soveltuu käytettäväksi pandas
-kirjaston DataFrame
-objektien kanssa. Voit antaa taulukkolistan tai DataFrame
-objektin arvoksi data
-parametriin. x
- tai y
-parametrille voit antaa DataFrame
-objektin sarakkeen nimen.
import seaborn as sns import matplotlib.pyplot as plt # Loading a built-in dataset of the Titanic passengers titanic_df = sns.load_dataset('titanic') sns.countplot(data=titanic_df, x='class') plt.show()
Tässä esimerkissä funktio luo countplot-kuvaajan käyttäen Titanic-'class'
-objektin DataFrame
-saraketta, näyttäen kuinka monta havaintoa kullekin sarakkeen uniikille arvolle löytyy.
Swipe to start coding
- Tuo
seaborn
-kirjasto aliaksellasns
. - Tuo
matplotlib.pyplot
-moduuli aliaksellaplt
. - Käytä oikeaa funktiota countplotin luomiseen.
- Käytä
diamonds
ensimmäisenä argumenttinaDataFrame
. - Käytä
'cut'
DataFramendiamonds
-sarake countplotin kategorioina ja näytä kategoriat y-akselilla toisella argumentilla. - Näytä kuvaaja käyttämällä oikeaa funktiota.
Ratkaisu
Kiitos palautteestasi!