Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Visualisierung von Korrelationen mit Heatmaps | Grundlegende Statistische Analyse
Datenanalyse Mit R

bookVisualisierung von Korrelationen mit Heatmaps

Korrelationsmatrizen können allein anhand von Zahlen schwer zu interpretieren sein. Heatmaps bieten eine visuelle Möglichkeit, die Stärke und Richtung von Zusammenhängen zwischen Variablen darzustellen.

Warum eine Korrelations-Heatmap verwenden?

Eine Korrelations-Heatmap bietet eine visuelle Möglichkeit, Beziehungen zwischen numerischen Variablen zu untersuchen. Durch die Verwendung von Farben zur Darstellung der Stärke und Richtung der Korrelationen lassen sich starke oder schwache Zusammenhänge auf einen Blick erkennen. Dies ist besonders hilfreich bei der Arbeit mit vielen Variablen, da Muster schnell sichtbar werden, Multikollinearität hervorgehoben und die weitere Analyse gezielt gesteuert werden kann.

Visualisierung der Korrelationsmatrix mit einer Heatmap

Zuerst muss eine Korrelationsmatrix zur Visualisierung erstellt werden:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Anschließend kann die Funktion ggcorrplot() verwendet werden, um daraus ein Diagramm zu erstellen:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Diese Funktion verfügt über mehrere Parameter, mit denen das Aussehen des Diagramms angepasst werden kann:

  • method = "square" sorgt dafür, dass jede Zelle als Quadrat dargestellt wird;
  • lab = TRUE blendet die Korrelationswerte in jedem Block ein;
  • colors geben die Richtung an: rot (negativ), weiß (neutral), grün (positiv);
  • theme_light() verleiht dem Diagramm einen klaren, minimalistischen Stil.
question mark

Welche Funktion aus dem Paket ggcorrplot wird verwendet, um Korrelationen zu visualisieren?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 6

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

What do the different colors in the heatmap represent?

How can I interpret the values shown on the heatmap?

Can I customize the appearance of the correlation heatmap further?

Awesome!

Completion rate improved to 4

bookVisualisierung von Korrelationen mit Heatmaps

Swipe um das Menü anzuzeigen

Korrelationsmatrizen können allein anhand von Zahlen schwer zu interpretieren sein. Heatmaps bieten eine visuelle Möglichkeit, die Stärke und Richtung von Zusammenhängen zwischen Variablen darzustellen.

Warum eine Korrelations-Heatmap verwenden?

Eine Korrelations-Heatmap bietet eine visuelle Möglichkeit, Beziehungen zwischen numerischen Variablen zu untersuchen. Durch die Verwendung von Farben zur Darstellung der Stärke und Richtung der Korrelationen lassen sich starke oder schwache Zusammenhänge auf einen Blick erkennen. Dies ist besonders hilfreich bei der Arbeit mit vielen Variablen, da Muster schnell sichtbar werden, Multikollinearität hervorgehoben und die weitere Analyse gezielt gesteuert werden kann.

Visualisierung der Korrelationsmatrix mit einer Heatmap

Zuerst muss eine Korrelationsmatrix zur Visualisierung erstellt werden:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Anschließend kann die Funktion ggcorrplot() verwendet werden, um daraus ein Diagramm zu erstellen:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Diese Funktion verfügt über mehrere Parameter, mit denen das Aussehen des Diagramms angepasst werden kann:

  • method = "square" sorgt dafür, dass jede Zelle als Quadrat dargestellt wird;
  • lab = TRUE blendet die Korrelationswerte in jedem Block ein;
  • colors geben die Richtung an: rot (negativ), weiß (neutral), grün (positiv);
  • theme_light() verleiht dem Diagramm einen klaren, minimalistischen Stil.
question mark

Welche Funktion aus dem Paket ggcorrplot wird verwendet, um Korrelationen zu visualisieren?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 6
some-alt