Joint Plot
Joint plot er en ganske unik graf, siden den kombinerer flere diagrammer. Det er et diagram som viser forholdet mellom to variabler sammen med deres individuelle fordelinger.
Grunnleggende har den tre elementer som standard:
Histogram øverst som representerer fordelingen av en bestemt variabel;
Histogram til høyre som representerer fordelingen av en annen variabel;
Scatter plot i midten som viser forholdet mellom disse to variablene.
Her er et eksempel på en joint plot:
Data for joint plot
seaborn
har en jointplot()
-funksjon som, på samme måte som countplot()
og kdeplot()
, har tre viktigste parametere:
data
;x
;y
.
Parameterne x
og y
angir variablene som skal plottes, som tilsvarer histogrammene til høyre og øverst. Disse parameterne kan være array-lignende objekter eller kolonnenavn når data
-parameteren er en DataFrame.
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Det innledende eksempelet er gjenskapt ved å tilordne en DataFrame til data
-parameteren og spesifisere kolonnenavn for x
og y
.
Plot i midten
En annen nyttig parameter er kind
, som angir hvilken plot du har i midten. Standardverdien er 'scatter'
. Andre mulige plottyper er: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Prøv gjerne ut ulike plottyper:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Plottyper
Selv om spredningsdiagrammet er det vanligste valget for det sentrale plottet, finnes det flere andre alternativer:
reg: Legger til en lineær regresjonslinje til spredningsdiagrammet, nyttig for å undersøke korrelasjon mellom variabler;
resid: Viser residualene fra en lineær regresjon;
hist: Viser et bivariat histogram for to variabler;
kde: Lager et KDE-plott;
hex: Produserer et hexbin-plott, hvor heksagonale ruter erstatter individuelle punkter, og fargen på rutene indikerer datatetthet.
Som vanlig kan du utforske flere alternativer og parametere i jointplot()
dokumentasjonen.
Det er også verdt å utforske de nevnte temaene:
residplot()
dokumentasjonen;
Eksempel på bivariat histogram;
Eksempel på hexbin-plott.
Swipe to start coding
- Bruk riktig funksjon for å lage et joint plot.
- Bruk
weather_df
som data for plottet (første argument). - Angi kolonnen
'Boston'
som variabel for x-aksen (andre argument). - Angi kolonnen
'Seattle'
som variabel for y-aksen (tredje argument). - Angi at plottet i midten skal ha en regresjonslinje (siste argument).
Løsning
Takk for tilbakemeldingene dine!