Joint-plot
Joint plot er en ret unik graf, da den kombinerer flere grafer. Det er et diagram, der viser forholdet mellem to variable sammen med deres individuelle fordelinger.
Grundlæggende har den tre elementer som standard:
Histogram øverst, som repræsenterer fordelingen af en bestemt variabel;
Histogram til højre, som repræsenterer fordelingen af en anden variabel;
Scatter plot i midten, som viser forholdet mellem disse to variable.
Her er et eksempel på et joint plot:
Data til Joint Plot
seaborn
har en jointplot()
funktion, som ligesom countplot()
og kdeplot()
har tre vigtigste parametre:
data
;x
;y
.
Parametrene x
og y
angiver de variable, der skal plottes, hvilket svarer til histogrammerne til højre og øverst. Disse parametre kan være array-lignende objekter eller kolonnenavne, når data
-parameteren er et DataFrame.
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Det oprindelige eksempel er blevet genskabt ved at tildele en DataFrame til parameteren data
og angive kolonnenavne for x
og y
.
Plot i midten
En anden nyttig parameter er kind
, som angiver den plottype, der vises i midten. Standardværdien er 'scatter'
. Andre mulige plottyper er: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Prøv gerne forskellige plottyper:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Plottyper
Selvom scatter plot er det mest almindelige valg til det centrale plot, findes der flere andre muligheder:
reg: Tilføjer en lineær regressionslinje til scatter plottet, nyttig til kontrol af korrelation mellem variable;
resid: Viser residualerne fra en lineær regression;
hist: Viser et bivariat histogram for to variable;
kde: Opretter et KDE-plot;
hex: Genererer et hexbin-plot, hvor sekskantede bins erstatter individuelle punkter, og bin-farven angiver datatæthed.
Som sædvanligt kan du udforske flere muligheder og parametre i jointplot()
dokumentationen.
Det er også værd at udforske de nævnte emner:
residplot()
dokumentationen;
Eksempel på bivariat histogram;
Eksempel på hexbin-plot.
Swipe to start coding
- Brug den korrekte funktion til at oprette et joint plot.
- Brug
weather_df
som data til plottet (første argument). - Angiv kolonnen
'Boston'
som variabel for x-aksen (andet argument). - Angiv kolonnen
'Seattle'
som variabel for y-aksen (tredje argument). - Indstil plottet i midten til at have en regressionslinje (sidste argument).
Løsning
Tak for dine kommentarer!