Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Pariplotti | Visualisointi Seabornilla
Ultimate Visualization with Python

bookPariplotti

Note
Määritelmä

Pair plot -kaaviota käytetään kuvaamaan numeeristen muuttujien välisiä parittaisia suhteita aineistossa. Se muistuttaa joint plot -kaaviota, mutta sitä ei ole rajoitettu vain kahteen muuttujaan. Pair plot muodostaa itse asiassa NxN-ruudukon Axes-olioita (useita alikuvioita), missä N on numeeristen muuttujien määrä (DataFrame:n numeeriset sarakkeet).

Pair plot -esimerkki

Pair plotin kuvaus

Pair plotissa jokainen sarake jakaa saman x-akselin muuttujan ja jokainen rivi saman y-akselin muuttujan. Diagonaalilla esitetään yksittäisten muuttujien histogrammit, kun taas muut kuviot näyttävät hajontakuvioita.

Pariplotin luominen

Pariplotin luominen seaborn-kirjastolla tapahtuu kutsumalla sen pairplot()-funktiota. Sen tärkein ja ainoa pakollinen parametri on data, jonka tulee olla DataFrame-olio.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame iris_df välitetään pairplot()-funktiolle. Parametrit height ja aspect määrittävät kunkin facetin korkeuden ja leveyden (lasketaan korkeuden ja aspectin tulona) tuumina.

Hue

Toinen huomionarvoinen parametri on hue, joka määrittää muuttujan (sarakkeen nimen) data-aineistossa, jonka perusteella kuvaajan ominaisuudet voidaan liittää eri väreihin tai jopa luoda erilliset kuvaajat (yhdelle Axes-akselille) kullekin sen arvolle.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Ero on tässä selvästi nähtävissä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajiin perustuen, käyttäen species-sarakkeen arvoja. Diagonaaliset kuvaajat ovat nyt KDE-kuvaajia jokaiselle lajille histogrammien sijaan.

Luokitteluongelmissa on usein järkevää luoda pair plot, jossa hue-parametri asetetaan kohdemuuttujaksi, eli kategoriseksi muuttujaksi, jota halutaan ennustaa.


Ero on selvä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajin mukaan, perustuen species-sarakkeen arvoihin. Diagonaaliset kuvaajat on korvattu KDE-kuvaajilla jokaiselle lajille histogrammien sijaan.

Luokittelutehtävissä pair plotin luominen siten, että hue-parametri asetetaan kohdemuuttujaksi — kategorinen muuttuja, jota ennustetaan — on usein hyödyllistä.

Kaaviotyypin muuttaminen

Voit vaihtaa käytettyjen kaavioiden tyyppiä oletusarvoisten hajontakaavioiden sijaan sekä diagonaalilla näytettäviä kaavioita. Parametri kind ohjaa pääkaavioita ja oletuksena käyttää hajontakaavioita, kun taas parametri diag_kind ohjaa diagonaalikaavioita ja valitaan automaattisesti sen perusteella, onko hue-parametri asetettu.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' ovat mahdollisia arvoja kind-parametrille.

diag_kind voidaan asettaa johonkin seuraavista arvoista:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Kaikki on tältä osin samanlaista kuin jointplot()-funktiossa.

Note
Lisätietoa
Tehtävä

Swipe to start coding

  1. Käytä oikeaa funktiota pariplotin luomiseen.
  2. Aseta piirrettävän datan arvoksi penguins_df ensimmäisenä argumenttina.
  3. Aseta sarakkeeksi 'sex', joka määrittää eri värit kuvaajassa toisen argumentin avulla.
  4. Aseta ei-diagonaalisille kuvaajille regressiosuora 'reg' kolmannen argumentin avulla.
  5. Aseta height arvoksi 2.
  6. Aseta aspect arvoksi 0.8.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 6
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What other parameters can I use with the pairplot() function?

Can you explain the difference between 'kind' and 'diag_kind' in more detail?

How do I interpret the KDE plots on the diagonal?

close

Awesome!

Completion rate improved to 3.85

bookPariplotti

Pyyhkäise näyttääksesi valikon

Note
Määritelmä

Pair plot -kaaviota käytetään kuvaamaan numeeristen muuttujien välisiä parittaisia suhteita aineistossa. Se muistuttaa joint plot -kaaviota, mutta sitä ei ole rajoitettu vain kahteen muuttujaan. Pair plot muodostaa itse asiassa NxN-ruudukon Axes-olioita (useita alikuvioita), missä N on numeeristen muuttujien määrä (DataFrame:n numeeriset sarakkeet).

Pair plot -esimerkki

Pair plotin kuvaus

Pair plotissa jokainen sarake jakaa saman x-akselin muuttujan ja jokainen rivi saman y-akselin muuttujan. Diagonaalilla esitetään yksittäisten muuttujien histogrammit, kun taas muut kuviot näyttävät hajontakuvioita.

Pariplotin luominen

Pariplotin luominen seaborn-kirjastolla tapahtuu kutsumalla sen pairplot()-funktiota. Sen tärkein ja ainoa pakollinen parametri on data, jonka tulee olla DataFrame-olio.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame iris_df välitetään pairplot()-funktiolle. Parametrit height ja aspect määrittävät kunkin facetin korkeuden ja leveyden (lasketaan korkeuden ja aspectin tulona) tuumina.

Hue

Toinen huomionarvoinen parametri on hue, joka määrittää muuttujan (sarakkeen nimen) data-aineistossa, jonka perusteella kuvaajan ominaisuudet voidaan liittää eri väreihin tai jopa luoda erilliset kuvaajat (yhdelle Axes-akselille) kullekin sen arvolle.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Ero on tässä selvästi nähtävissä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajiin perustuen, käyttäen species-sarakkeen arvoja. Diagonaaliset kuvaajat ovat nyt KDE-kuvaajia jokaiselle lajille histogrammien sijaan.

Luokitteluongelmissa on usein järkevää luoda pair plot, jossa hue-parametri asetetaan kohdemuuttujaksi, eli kategoriseksi muuttujaksi, jota halutaan ennustaa.


Ero on selvä. Jokaisen hajontakuvion datapisteet on väritetty niiden lajin mukaan, perustuen species-sarakkeen arvoihin. Diagonaaliset kuvaajat on korvattu KDE-kuvaajilla jokaiselle lajille histogrammien sijaan.

Luokittelutehtävissä pair plotin luominen siten, että hue-parametri asetetaan kohdemuuttujaksi — kategorinen muuttuja, jota ennustetaan — on usein hyödyllistä.

Kaaviotyypin muuttaminen

Voit vaihtaa käytettyjen kaavioiden tyyppiä oletusarvoisten hajontakaavioiden sijaan sekä diagonaalilla näytettäviä kaavioita. Parametri kind ohjaa pääkaavioita ja oletuksena käyttää hajontakaavioita, kun taas parametri diag_kind ohjaa diagonaalikaavioita ja valitaan automaattisesti sen perusteella, onko hue-parametri asetettu.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' ovat mahdollisia arvoja kind-parametrille.

diag_kind voidaan asettaa johonkin seuraavista arvoista:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Kaikki on tältä osin samanlaista kuin jointplot()-funktiossa.

Note
Lisätietoa
Tehtävä

Swipe to start coding

  1. Käytä oikeaa funktiota pariplotin luomiseen.
  2. Aseta piirrettävän datan arvoksi penguins_df ensimmäisenä argumenttina.
  3. Aseta sarakkeeksi 'sex', joka määrittää eri värit kuvaajassa toisen argumentin avulla.
  4. Aseta ei-diagonaalisille kuvaajille regressiosuora 'reg' kolmannen argumentin avulla.
  5. Aseta height arvoksi 2.
  6. Aseta aspect arvoksi 0.8.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 6
single

single

some-alt