Visualisierung von Korrelationen mit Heatmaps
Korrelationsmatrizen können schwer verständlich sein, wenn man nur die Zahlen betrachtet. Heatmaps bieten eine visuelle Möglichkeit, die Stärke und Richtung der Beziehungen zwischen Variablen zu erkennen.
Warum eine Korrelations-Heatmap verwenden?
Eine Korrelations-Heatmap bietet eine visuelle Methode, um Beziehungen zwischen numerischen Variablen zu untersuchen. Durch die Verwendung von Farben zur Darstellung der Stärke und Richtung von Korrelationen lassen sich starke oder schwache Zusammenhänge auf einen Blick erkennen. Dies ist besonders hilfreich bei der Arbeit mit vielen Variablen, da Muster schnell sichtbar werden, Multikollinearität hervorgehoben und die weitere Analyse gezielt gesteuert werden kann.
Visualisierung der Korrelationsmatrix mit einer Heatmap
Zuerst muss eine Korrelationsmatrix für die Visualisierung erstellt werden:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Anschließend kann die Funktion ggcorrplot()
verwendet werden, um daraus ein Diagramm zu erstellen:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Diese Funktion bietet verschiedene Parameter, mit denen sich das Aussehen des Diagramms anpassen lässt:
method = "square"
sorgt dafür, dass jede Zelle ein Quadrat ist;lab = TRUE
blendet die Korrelationswerte in jedem Block ein;colors
zeigen die Richtung an: rot (negativ), weiß (neutral), grün (positiv);theme_light()
verleiht dem Diagramm einen klaren, minimalistischen Stil.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4
Visualisierung von Korrelationen mit Heatmaps
Swipe um das Menü anzuzeigen
Korrelationsmatrizen können schwer verständlich sein, wenn man nur die Zahlen betrachtet. Heatmaps bieten eine visuelle Möglichkeit, die Stärke und Richtung der Beziehungen zwischen Variablen zu erkennen.
Warum eine Korrelations-Heatmap verwenden?
Eine Korrelations-Heatmap bietet eine visuelle Methode, um Beziehungen zwischen numerischen Variablen zu untersuchen. Durch die Verwendung von Farben zur Darstellung der Stärke und Richtung von Korrelationen lassen sich starke oder schwache Zusammenhänge auf einen Blick erkennen. Dies ist besonders hilfreich bei der Arbeit mit vielen Variablen, da Muster schnell sichtbar werden, Multikollinearität hervorgehoben und die weitere Analyse gezielt gesteuert werden kann.
Visualisierung der Korrelationsmatrix mit einer Heatmap
Zuerst muss eine Korrelationsmatrix für die Visualisierung erstellt werden:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Anschließend kann die Funktion ggcorrplot()
verwendet werden, um daraus ein Diagramm zu erstellen:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Diese Funktion bietet verschiedene Parameter, mit denen sich das Aussehen des Diagramms anpassen lässt:
method = "square"
sorgt dafür, dass jede Zelle ein Quadrat ist;lab = TRUE
blendet die Korrelationswerte in jedem Block ein;colors
zeigen die Richtung an: rot (negativ), weiß (neutral), grün (positiv);theme_light()
verleiht dem Diagramm einen klaren, minimalistischen Stil.
Danke für Ihr Feedback!