Pariplotti
Pair plot -kaaviota käytetään kuvaamaan numeeristen muuttujien välisiä parittaisia suhteita aineistossa. Se muistuttaa joint plot -kaaviota, mutta sitä ei ole rajoitettu vain kahteen muuttujaan. Pair plot muodostaa itse asiassa NxN-ruudukon Axes-olioita (useita alikuvioita), missä N on numeeristen muuttujien määrä (DataFrame:n numeeriset sarakkeet).
Pair plotin kuvaus
Pair plotissa jokainen sarake jakaa saman x-akselin muuttujan ja jokainen rivi saman y-akselin muuttujan. Diagonaalilla esitetään yksittäisten muuttujien histogrammit, kun taas muut kuviot näyttävät hajontakuvioita.
Pariplotin luominen
Pariplotin luominen seaborn-kirjastolla tapahtuu kutsumalla sen pairplot()-funktiota. Sen tärkein ja ainoa pakollinen parametri on data, jonka tulee olla DataFrame-olio.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame iris_df välitetään pairplot()-funktiolle. Parametrit height ja aspect määrittävät kunkin facetin korkeuden ja leveyden (lasketaan korkeuden ja aspectin tulona) tuumina.
Hue
Toinen huomionarvoinen parametri on hue, joka määrittää muuttujan (sarakkeen nimen) data-aineistossa, jonka perusteella kuvaajan ominaisuudet voidaan liittää eri väreihin tai jopa luoda erilliset kuvaajat (yhdelle Axes-akselille) kullekin sen arvolle.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Ero on tässä selvästi nähtävissä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajiin perustuen, käyttäen species-sarakkeen arvoja. Diagonaaliset kuvaajat ovat nyt KDE-kuvaajia jokaiselle lajille histogrammien sijaan.
Luokitteluongelmissa on usein järkevää luoda pair plot, jossa hue-parametri asetetaan kohdemuuttujaksi, eli kategoriseksi muuttujaksi, jota halutaan ennustaa.
Ero on selvä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajin mukaan, perustuen species-sarakkeen arvoihin. Diagonaaliset kuvaajat on korvattu KDE-kuvaajilla jokaiselle lajille histogrammien sijaan.
Luokittelutehtävissä pair plotin luominen siten, että hue-parametri asetetaan kohdemuuttujaksi — kategorinen muuttuja, jota ennustetaan — on usein hyödyllistä.
Kaaviotyypin muuttaminen
Voit vaihtaa käytettyjen kaavioiden tyyppiä oletusarvoisten hajontakaavioiden sijaan sekä diagonaalilla näytettäviä kaavioita. Parametri kind ohjaa pääkaavioita ja oletuksena käyttää hajontakaavioita, kun taas parametri diag_kind ohjaa diagonaalikaavioita ja valitaan automaattisesti sen perusteella, onko hue-parametri asetettu.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' ovat mahdollisia arvoja kind-parametrille.
diag_kind voidaan asettaa johonkin seuraavista arvoista:
'auto';'hist';'kde';None.
Kaikki on tältä osin samanlaista kuin jointplot()-funktiossa.
Tutustu lisää pairplot()-dokumentaatiossa.
Swipe to start coding
- Käytä oikeaa funktiota pariplotin luomiseen.
- Aseta piirrettävän datan arvoksi
penguins_dfensimmäisenä argumenttina. - Aseta sarakkeeksi
'sex', joka määrittää eri värit kuvaajassa toisen argumentin avulla. - Aseta ei-diagonaalisille kuvaajille regressiosuora
'reg'kolmannen argumentin avulla. - Aseta
heightarvoksi2. - Aseta
aspectarvoksi0.8.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
What other parameters can I use with the pairplot() function?
Can you explain the difference between 'kind' and 'diag_kind' in more detail?
How do I interpret the KDE plots on the diagonal?
Awesome!
Completion rate improved to 3.85
Pariplotti
Pyyhkäise näyttääksesi valikon
Pair plot -kaaviota käytetään kuvaamaan numeeristen muuttujien välisiä parittaisia suhteita aineistossa. Se muistuttaa joint plot -kaaviota, mutta sitä ei ole rajoitettu vain kahteen muuttujaan. Pair plot muodostaa itse asiassa NxN-ruudukon Axes-olioita (useita alikuvioita), missä N on numeeristen muuttujien määrä (DataFrame:n numeeriset sarakkeet).
Pair plotin kuvaus
Pair plotissa jokainen sarake jakaa saman x-akselin muuttujan ja jokainen rivi saman y-akselin muuttujan. Diagonaalilla esitetään yksittäisten muuttujien histogrammit, kun taas muut kuviot näyttävät hajontakuvioita.
Pariplotin luominen
Pariplotin luominen seaborn-kirjastolla tapahtuu kutsumalla sen pairplot()-funktiota. Sen tärkein ja ainoa pakollinen parametri on data, jonka tulee olla DataFrame-olio.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame iris_df välitetään pairplot()-funktiolle. Parametrit height ja aspect määrittävät kunkin facetin korkeuden ja leveyden (lasketaan korkeuden ja aspectin tulona) tuumina.
Hue
Toinen huomionarvoinen parametri on hue, joka määrittää muuttujan (sarakkeen nimen) data-aineistossa, jonka perusteella kuvaajan ominaisuudet voidaan liittää eri väreihin tai jopa luoda erilliset kuvaajat (yhdelle Axes-akselille) kullekin sen arvolle.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Ero on tässä selvästi nähtävissä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajiin perustuen, käyttäen species-sarakkeen arvoja. Diagonaaliset kuvaajat ovat nyt KDE-kuvaajia jokaiselle lajille histogrammien sijaan.
Luokitteluongelmissa on usein järkevää luoda pair plot, jossa hue-parametri asetetaan kohdemuuttujaksi, eli kategoriseksi muuttujaksi, jota halutaan ennustaa.
Ero on selvä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajin mukaan, perustuen species-sarakkeen arvoihin. Diagonaaliset kuvaajat on korvattu KDE-kuvaajilla jokaiselle lajille histogrammien sijaan.
Luokittelutehtävissä pair plotin luominen siten, että hue-parametri asetetaan kohdemuuttujaksi — kategorinen muuttuja, jota ennustetaan — on usein hyödyllistä.
Kaaviotyypin muuttaminen
Voit vaihtaa käytettyjen kaavioiden tyyppiä oletusarvoisten hajontakaavioiden sijaan sekä diagonaalilla näytettäviä kaavioita. Parametri kind ohjaa pääkaavioita ja oletuksena käyttää hajontakaavioita, kun taas parametri diag_kind ohjaa diagonaalikaavioita ja valitaan automaattisesti sen perusteella, onko hue-parametri asetettu.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' ovat mahdollisia arvoja kind-parametrille.
diag_kind voidaan asettaa johonkin seuraavista arvoista:
'auto';'hist';'kde';None.
Kaikki on tältä osin samanlaista kuin jointplot()-funktiossa.
Tutustu lisää pairplot()-dokumentaatiossa.
Swipe to start coding
- Käytä oikeaa funktiota pariplotin luomiseen.
- Aseta piirrettävän datan arvoksi
penguins_dfensimmäisenä argumenttina. - Aseta sarakkeeksi
'sex', joka määrittää eri värit kuvaajassa toisen argumentin avulla. - Aseta ei-diagonaalisille kuvaajille regressiosuora
'reg'kolmannen argumentin avulla. - Aseta
heightarvoksi2. - Aseta
aspectarvoksi0.8.
Ratkaisu
Kiitos palautteestasi!
single