Joint-Plot
Joint Plot ist ein eher einzigartiges Diagramm, da es mehrere Diagrammtypen kombiniert. Es handelt sich um ein Diagramm, das die Beziehung zwischen zwei Variablen sowie deren individuelle Verteilungen darstellt.
Grundsätzlich besteht es standardmäßig aus drei Elementen:
Histogramm oben, das die Verteilung einer bestimmten Variablen darstellt;
Histogramm rechts, das die Verteilung einer anderen Variablen darstellt;
Streudiagramm in der Mitte, das die Beziehung zwischen diesen beiden Variablen zeigt.
Hier ist ein Beispiel für ein Joint Plot:
Daten für das Joint Plot
seaborn
verfügt über eine jointplot()
-Funktion, die ähnlich wie countplot()
und kdeplot()
drei wichtigste Parameter hat:
data
;x
;y
.
Die Parameter x
und y
geben die zu zeichnenden Variablen an, die den Histogrammen rechts und oben entsprechen. Diese Parameter können array-ähnliche Objekte oder Spaltennamen sein, wenn der Parameter data
ein DataFrame ist.
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width") plt.show()
Das Anfangsbeispiel wurde nachgebildet, indem ein DataFrame dem Parameter data
zugewiesen und die Spaltennamen für x
und y
angegeben wurden.
Plot in der Mitte
Ein weiterer nützlicher Parameter ist kind
, der das Diagramm angibt, das in der Mitte angezeigt wird. Der Standardwert ist 'scatter'
. Weitere mögliche Diagrammtypen sind: 'kde'
, 'hist'
, 'hex'
, 'reg'
, 'resid'
. Es empfiehlt sich, mit verschiedenen Diagrammtypen zu experimentieren:
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris flowers species iris_df = sns.load_dataset("iris") sns.jointplot(data=iris_df, x="sepal_length", y="sepal_width", kind='reg') plt.show()
Plot-Typen
Obwohl das Streudiagramm die gebräuchlichste Wahl für das zentrale Diagramm ist, stehen mehrere weitere Optionen zur Verfügung:
reg: Fügt dem Streudiagramm eine lineare Regressionslinie hinzu, nützlich zur Überprüfung der Korrelation zwischen Variablen;
resid: Zeigt die Residuen einer linearen Regression an;
hist: Stellt ein bivariates Histogramm für zwei Variablen dar;
kde: Erstellt ein KDE-Diagramm;
hex: Erzeugt ein Hexbin-Diagramm, bei dem sechseckige Bins einzelne Punkte ersetzen und die Bin-Farbe die Datendichte anzeigt.
Wie üblich können Sie weitere Optionen und Parameter in der jointplot()
-Dokumentation erkunden.
Es lohnt sich außerdem, die genannten Themen zu betrachten:
residplot()
-Dokumentation;
Beispiel für ein bivariates Histogramm;
Beispiel für ein Hexbin-Diagramm.
Swipe to start coding
- Die korrekte Funktion zur Erstellung eines Joint Plots verwenden.
weather_df
als Datensatz für das Diagramm nutzen (erstes Argument).- Die Spalte
'Boston'
als Variable für die x-Achse festlegen (zweites Argument). - Die Spalte
'Seattle'
als Variable für die y-Achse festlegen (drittes Argument). - Das mittlere Diagramm mit einer Regressionslinie versehen (rechtes Argument).
Lösung
Danke für Ihr Feedback!