Visualisering af Korrelationer med Varmekort
Stryg for at vise menuen
Korrelationstabeller kan være svære at tolke blot ved at se på tallene. Heatmaps giver en visuel måde at se styrken og retningen af relationer mellem variable.
Hvorfor bruge et korrelations-heatmap?
Et korrelations-heatmap giver en visuel metode til at undersøge relationer mellem numeriske variable. Ved at bruge farver til at repræsentere styrken og retningen af korrelationer, bliver det meget lettere hurtigt at identificere stærke eller svage sammenhænge. Dette er især nyttigt, når man arbejder med mange variable, da det hurtigt kan afsløre mønstre, fremhæve multikollinearitet og vejlede videre analyse.
Visualisering af korrelationsmatrix med heatmap
Først skal du oprette en korrelationsmatrix til visualisering:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Derefter kan du bruge funktionen ggcorrplot() til at oprette et plot ud fra den:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Denne funktion har flere parametre, der kan bruges til at ændre plottets stil:
method = "square"gør hver celle til et kvadratisk blok;lab = TRUEviser korrelationsværdierne ovenpå hver blok;colorsangiver retning: rød (negativ), hvid (neutral), grøn (positiv);theme_light()giver plottet et rent, minimalistisk udseende.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat