Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Visualisierung von Korrelationen mit Heatmaps | Grundlegende Statistische Analyse
Datenanalyse Mit R

bookVisualisierung von Korrelationen mit Heatmaps

Korrelationsmatrizen können schwer verständlich sein, wenn man nur die Zahlen betrachtet. Heatmaps bieten eine visuelle Möglichkeit, die Stärke und Richtung der Beziehungen zwischen Variablen zu erkennen.

Warum eine Korrelations-Heatmap verwenden?

Eine Korrelations-Heatmap bietet eine visuelle Methode, um Beziehungen zwischen numerischen Variablen zu untersuchen. Durch die Verwendung von Farben zur Darstellung der Stärke und Richtung von Korrelationen lassen sich starke oder schwache Zusammenhänge auf einen Blick erkennen. Dies ist besonders hilfreich bei der Arbeit mit vielen Variablen, da Muster schnell sichtbar werden, Multikollinearität hervorgehoben und die weitere Analyse gezielt gesteuert werden kann.

Visualisierung der Korrelationsmatrix mit einer Heatmap

Zuerst muss eine Korrelationsmatrix für die Visualisierung erstellt werden:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Anschließend kann die Funktion ggcorrplot() verwendet werden, um daraus ein Diagramm zu erstellen:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Diese Funktion bietet verschiedene Parameter, mit denen sich das Aussehen des Diagramms anpassen lässt:

  • method = "square" sorgt dafür, dass jede Zelle ein Quadrat ist;
  • lab = TRUE blendet die Korrelationswerte in jedem Block ein;
  • colors zeigen die Richtung an: rot (negativ), weiß (neutral), grün (positiv);
  • theme_light() verleiht dem Diagramm einen klaren, minimalistischen Stil.
question mark

Welche Funktion aus dem Paket ggcorrplot wird verwendet, um Korrelationen zu visualisieren?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 6

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 4

bookVisualisierung von Korrelationen mit Heatmaps

Swipe um das Menü anzuzeigen

Korrelationsmatrizen können schwer verständlich sein, wenn man nur die Zahlen betrachtet. Heatmaps bieten eine visuelle Möglichkeit, die Stärke und Richtung der Beziehungen zwischen Variablen zu erkennen.

Warum eine Korrelations-Heatmap verwenden?

Eine Korrelations-Heatmap bietet eine visuelle Methode, um Beziehungen zwischen numerischen Variablen zu untersuchen. Durch die Verwendung von Farben zur Darstellung der Stärke und Richtung von Korrelationen lassen sich starke oder schwache Zusammenhänge auf einen Blick erkennen. Dies ist besonders hilfreich bei der Arbeit mit vielen Variablen, da Muster schnell sichtbar werden, Multikollinearität hervorgehoben und die weitere Analyse gezielt gesteuert werden kann.

Visualisierung der Korrelationsmatrix mit einer Heatmap

Zuerst muss eine Korrelationsmatrix für die Visualisierung erstellt werden:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Anschließend kann die Funktion ggcorrplot() verwendet werden, um daraus ein Diagramm zu erstellen:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Diese Funktion bietet verschiedene Parameter, mit denen sich das Aussehen des Diagramms anpassen lässt:

  • method = "square" sorgt dafür, dass jede Zelle ein Quadrat ist;
  • lab = TRUE blendet die Korrelationswerte in jedem Block ein;
  • colors zeigen die Richtung an: rot (negativ), weiß (neutral), grün (positiv);
  • theme_light() verleiht dem Diagramm einen klaren, minimalistischen Stil.
question mark

Welche Funktion aus dem Paket ggcorrplot wird verwendet, um Korrelationen zu visualisieren?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 6
some-alt