Sambandsdiagram
Joint plot är ett ganska unikt diagram, eftersom det kombinerar flera diagram. Det är ett diagram som visar sambandet mellan två variabler tillsammans med deras individuella fördelningar.
I grunden har det tre element som standard:
Histogram högst upp som representerar fördelningen av en viss variabel;
Histogram till höger som representerar fördelningen av en annan variabel;
Scatter plot i mitten som visar sambandet mellan dessa två variabler.
Här är ett exempel på ett joint plot:
Data för Joint Plot
seaborn
har en funktion jointplot()
som, likt countplot()
och kdeplot()
, har tre viktigaste parametrar:
data
;x
;y
.
Parametrarna x
och y
anger variablerna som ska plottas, vilket motsvarar histogrammen till höger och högst upp. Dessa parametrar kan vara array-liknande objekt eller kolumnnamn när parametern data
är en DataFrame.
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Det ursprungliga exemplet har återskapats genom att tilldela en DataFrame till parametern data
och ange kolumnnamn för x
och y
.
Diagram i mitten
En annan användbar parameter är kind
som specificerar vilket diagram som visas i mitten. Standardvärdet är 'scatter'
. Andra möjliga diagram är: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Prova gärna olika diagramtyper:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Diagramtyper
Även om spridningsdiagrammet är det vanligaste valet för den centrala grafen, finns det flera andra alternativ tillgängliga:
reg: Lägger till en linjär regressionsanpassning till spridningsdiagrammet, användbart för att kontrollera korrelation mellan variabler;
resid: Visar residualerna från en linjär regression;
hist: Visar ett bivariat histogram för två variabler;
kde: Skapar ett KDE-diagram;
hex: Producerar ett hexbin-diagram, där hexagonala fält ersätter enskilda punkter och fältets färg indikerar datatäthet.
Som vanligt kan du utforska fler alternativ och parametrar i jointplot()
dokumentationen.
Det är också värt att utforska de nämnda ämnena:
residplot()
dokumentationen;
Exempel på bivariat histogram;
Exempel på hexbin-diagram.
Swipe to start coding
- Använd rätt funktion för att skapa ett joint plot.
- Använd
weather_df
som data för diagrammet (det första argumentet). - Ange kolumnen
'Boston'
som variabel för x-axeln (det andra argumentet). - Ange kolumnen
'Seattle'
som variabel för y-axeln (det tredje argumentet). - Ställ in att diagrammet i mitten ska ha en regressionslinje (det sista argumentet).
Lösning
Tack för dina kommentarer!