Yhdistelmäkaavio
Joint plot on varsin ainutlaatuinen kuvaaja, sillä se yhdistää useita kuvaajia. Se on kaavio, joka näyttää kahden muuttujan välisen suhteen sekä niiden yksittäiset jakaumat.
Perustilassaan siinä on kolme elementtiä:
Histogrammi yläosassa, joka esittää tietyn muuttujan jakauman;
Histogrammi oikealla, joka esittää toisen muuttujan jakauman;
Hajontakuvio keskellä, joka näyttää näiden kahden muuttujan välisen suhteen.
Tässä on esimerkki joint plotista:
Data for the Joint Plot
seaborn
-kirjastossa on jointplot()
-funktio, jolla on samankaltaisesti kuin countplot()
- ja kdeplot()
-funktioilla kolme tärkeintä parametria:
data
;x
;y
.
x
- ja y
-parametrit määrittävät piirrettävät muuttujat, jotka vastaavat histogrammeja oikealla ja ylhäällä. Nämä parametrit voivat olla taulukkomaisia olioita tai sarakkeiden nimiä, kun data
-parametri on DataFrame.
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Alkuperäinen esimerkki on toteutettu määrittämällä DataFrame data
-parametriin ja nimeämällä sarakkeet x
ja y
.
Keskellä oleva kuvaaja
Toinen hyödyllinen parametri on kind
, jolla määritellään keskellä oleva kuvaajatyyppi. Oletusarvo on 'scatter'
. Muita mahdollisia arvoja ovat: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Kokeile rohkeasti erilaisia kuvaajia:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Kaaviotyypit
Vaikka hajontakaavio on yleisin valinta keskimmäiseksi kaavioksi, on tarjolla useita muita vaihtoehtoja:
reg: Lisää lineaarisen regressio-sovitteen hajontakaavioon, hyödyllinen korrelaation tarkistamiseen muuttujien välillä;
resid: Näyttää lineaarisen regression residuaalit;
hist: Esittää bivariaattisen histogrammin kahdelle muuttujalle;
kde: Luo KDE-kaavion;
hex: Tuottaa hexbin-kaavion, jossa yksittäiset pisteet korvataan kuusikulmaisilla soluilla ja solun väri ilmaisee datan tiheyden.
Kuten tavallista, voit tutkia lisää vaihtoehtoja ja parametreja jointplot()
-dokumentaatiossa.
Lisäksi kannattaa tutustua mainittuihin aiheisiin:
residplot()
-dokumentaatio;
Bivariaattisen histogrammin esimerkki;
Hexbin-kaavion esimerkki.
Swipe to start coding
- Käytä oikeaa funktiota yhteisjakaumakuvion luomiseen.
- Käytä
weather_df
-dataa kuvion aineistona (ensimmäinen argumentti). - Aseta x-akselin muuttujaksi
'Boston'
-sarake (toinen argumentti). - Aseta y-akselin muuttujaksi
'Seattle'
-sarake (kolmas argumentti). - Aseta keskimmäiseen kuvaajaan regressiosuora (viimeinen argumentti).
Ratkaisu
Kiitos palautteestasi!