Jointplot
Joint plot is een vrij uniek diagram, omdat het meerdere grafieken combineert. Het is een grafiek die de relatie tussen twee variabelen toont, samen met hun individuele verdelingen.
In de basis heeft het standaard drie elementen:
Histogram bovenaan dat de verdeling van een bepaalde variabele weergeeft;
Histogram aan de rechterkant dat de verdeling van een andere variabele weergeeft;
Spreidingsdiagram in het midden dat de relatie tussen deze twee variabelen toont.
Hier is een voorbeeld van een joint plot:
Gegevens voor de Joint Plot
seaborn
heeft een jointplot()
functie die, vergelijkbaar met countplot()
en kdeplot()
, drie belangrijkste parameters heeft:
data
;x
;y
.
De parameters x
en y
specificeren de te plotten variabelen, die overeenkomen met de histogrammen aan de rechterkant en bovenaan. Deze parameters kunnen array-achtige objecten zijn of kolomnamen wanneer de parameter data
een DataFrame is.
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Het oorspronkelijke voorbeeld is gereconstrueerd door een DataFrame toe te wijzen aan de parameter data
en kolomnamen te specificeren voor x
en y
.
Plot in het Midden
Een andere nuttige parameter is kind
, waarmee wordt aangegeven welk plot in het midden wordt weergegeven. 'scatter'
is de standaardwaarde. Andere mogelijke plots zijn: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Experimenteer gerust met verschillende plottypen:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Plottypen
Hoewel het spreidingsdiagram de meest gebruikelijke keuze is voor de centrale plot, zijn er verschillende andere opties beschikbaar:
reg: Voegt een lineaire regressie toe aan het spreidingsdiagram, nuttig voor het controleren van correlatie tussen variabelen;
resid: Toont de residuen van een lineaire regressie;
hist: Geeft een bivariate histogram weer voor twee variabelen;
kde: Maakt een KDE-plot;
hex: Produceert een hexbin-plot, waarbij zeshoekige bins individuele punten vervangen en de kleur van de bin de datadichtheid aangeeft.
Zoals gebruikelijk kunt u meer opties en parameters verkennen in de jointplot()
documentatie.
Het is ook de moeite waard om de genoemde onderwerpen te verkennen:
residplot()
documentatie;
Voorbeeld van een bivariate histogram;
Voorbeeld van een hexbin-plot.
Swipe to start coding
- Gebruik de juiste functie om een joint plot te maken.
- Gebruik
weather_df
als de data voor de plot (het eerste argument). - Stel de kolom
'Boston'
in als variabele voor de x-as (het tweede argument). - Stel de kolom
'Seattle'
in als variabele voor de y-as (het derde argument). - Stel in dat de plot in het midden een regressielijn bevat (het meest rechtse argument).
Oplossing
Bedankt voor je feedback!