Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Yhdistelmäkaavio | Visualisointi Seabornilla
Huipputason Visualisointi Pythonilla

Pyyhkäise näyttääksesi valikon

book
Yhdistelmäkaavio

Note
Määritelmä

Joint plot on varsin ainutlaatuinen kuvaaja, sillä se yhdistää useita kuvaajia. Se on kaavio, joka näyttää kahden muuttujan välisen suhteen sekä niiden yksittäiset jakaumat.

Perustilassaan siinä on kolme elementtiä:

  • Histogrammi yläosassa, joka esittää tietyn muuttujan jakauman;

  • Histogrammi oikealla, joka esittää toisen muuttujan jakauman;

  • Hajontakuvio keskellä, joka näyttää näiden kahden muuttujan välisen suhteen.

Tässä on esimerkki joint plotista:

Data for the Joint Plot

seaborn-kirjastossa on jointplot()-funktio, jolla on samankaltaisesti kuin countplot()- ja kdeplot()-funktioilla kolme tärkeintä parametria:

  • data;

  • x;

  • y.

x- ja y-parametrit määrittävät piirrettävät muuttujat, jotka vastaavat histogrammeja oikealla ja ylhäällä. Nämä parametrit voivat olla taulukkomaisia olioita tai sarakkeiden nimiä, kun data-parametri on DataFrame.

12345678
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
copy

Alkuperäinen esimerkki on toteutettu määrittämällä DataFrame data-parametriin ja nimeämällä sarakkeet x ja y.

Keskellä oleva kuvaaja

Toinen hyödyllinen parametri on kind, jolla määritellään keskellä oleva kuvaajatyyppi. Oletusarvo on 'scatter'. Muita mahdollisia arvoja ovat: 'kde', 'hist', 'hex', 'reg', 'resid'. Kokeile rohkeasti erilaisia kuvaajia:

12345678
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
copy

Kaaviotyypit

Vaikka hajontakaavio on yleisin valinta keskimmäiseksi kaavioksi, on tarjolla useita muita vaihtoehtoja:

  • reg: Lisää lineaarisen regressio-sovitteen hajontakaavioon, hyödyllinen korrelaation tarkistamiseen muuttujien välillä;

  • resid: Näyttää lineaarisen regression residuaalit;

  • hist: Esittää bivariaattisen histogrammin kahdelle muuttujalle;

  • kde: Luo KDE-kaavion;

  • hex: Tuottaa hexbin-kaavion, jossa yksittäiset pisteet korvataan kuusikulmaisilla soluilla ja solun väri ilmaisee datan tiheyden.

Note
Opiskele lisää

Kuten tavallista, voit tutkia lisää vaihtoehtoja ja parametreja jointplot() -dokumentaatiossa.

Lisäksi kannattaa tutustua mainittuihin aiheisiin:
residplot() -dokumentaatio;
Bivariaattisen histogrammin esimerkki;
Hexbin-kaavion esimerkki.

Tehtävä

Swipe to start coding

  1. Käytä oikeaa funktiota yhteisjakaumakuvion luomiseen.
  2. Käytä weather_df-dataa kuvion aineistona (ensimmäinen argumentti).
  3. Aseta x-akselin muuttujaksi 'Boston'-sarake (toinen argumentti).
  4. Aseta y-akselin muuttujaksi 'Seattle'-sarake (kolmas argumentti).
  5. Aseta keskimmäiseen kuvaajaan regressiosuora (viimeinen argumentti).

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5
Pahoittelemme, että jotain meni pieleen. Mitä tapahtui?

Kysy tekoälyä

expand
ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

book
Yhdistelmäkaavio

Note
Määritelmä

Joint plot on varsin ainutlaatuinen kuvaaja, sillä se yhdistää useita kuvaajia. Se on kaavio, joka näyttää kahden muuttujan välisen suhteen sekä niiden yksittäiset jakaumat.

Perustilassaan siinä on kolme elementtiä:

  • Histogrammi yläosassa, joka esittää tietyn muuttujan jakauman;

  • Histogrammi oikealla, joka esittää toisen muuttujan jakauman;

  • Hajontakuvio keskellä, joka näyttää näiden kahden muuttujan välisen suhteen.

Tässä on esimerkki joint plotista:

Data for the Joint Plot

seaborn-kirjastossa on jointplot()-funktio, jolla on samankaltaisesti kuin countplot()- ja kdeplot()-funktioilla kolme tärkeintä parametria:

  • data;

  • x;

  • y.

x- ja y-parametrit määrittävät piirrettävät muuttujat, jotka vastaavat histogrammeja oikealla ja ylhäällä. Nämä parametrit voivat olla taulukkomaisia olioita tai sarakkeiden nimiä, kun data-parametri on DataFrame.

12345678
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
copy

Alkuperäinen esimerkki on toteutettu määrittämällä DataFrame data-parametriin ja nimeämällä sarakkeet x ja y.

Keskellä oleva kuvaaja

Toinen hyödyllinen parametri on kind, jolla määritellään keskellä oleva kuvaajatyyppi. Oletusarvo on 'scatter'. Muita mahdollisia arvoja ovat: 'kde', 'hist', 'hex', 'reg', 'resid'. Kokeile rohkeasti erilaisia kuvaajia:

12345678
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
copy

Kaaviotyypit

Vaikka hajontakaavio on yleisin valinta keskimmäiseksi kaavioksi, on tarjolla useita muita vaihtoehtoja:

  • reg: Lisää lineaarisen regressio-sovitteen hajontakaavioon, hyödyllinen korrelaation tarkistamiseen muuttujien välillä;

  • resid: Näyttää lineaarisen regression residuaalit;

  • hist: Esittää bivariaattisen histogrammin kahdelle muuttujalle;

  • kde: Luo KDE-kaavion;

  • hex: Tuottaa hexbin-kaavion, jossa yksittäiset pisteet korvataan kuusikulmaisilla soluilla ja solun väri ilmaisee datan tiheyden.

Note
Opiskele lisää

Kuten tavallista, voit tutkia lisää vaihtoehtoja ja parametreja jointplot() -dokumentaatiossa.

Lisäksi kannattaa tutustua mainittuihin aiheisiin:
residplot() -dokumentaatio;
Bivariaattisen histogrammin esimerkki;
Hexbin-kaavion esimerkki.

Tehtävä

Swipe to start coding

  1. Käytä oikeaa funktiota yhteisjakaumakuvion luomiseen.
  2. Käytä weather_df-dataa kuvion aineistona (ensimmäinen argumentti).
  3. Aseta x-akselin muuttujaksi 'Boston'-sarake (toinen argumentti).
  4. Aseta y-akselin muuttujaksi 'Seattle'-sarake (kolmas argumentti).
  5. Aseta keskimmäiseen kuvaajaan regressiosuora (viimeinen argumentti).

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 5
Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Pahoittelemme, että jotain meni pieleen. Mitä tapahtui?
some-alt