Visualisering af Korrelationer med Varmekort
Korrelationsmatricer kan være svære at tolke blot ved at se på tal. Heatmaps giver en visuel metode til at se styrken og retningen af relationer mellem variable.
Hvorfor bruge et korrelations-heatmap?
Et korrelations-heatmap giver en visuel metode til at undersøge relationer mellem numeriske variable. Ved at bruge farver til at repræsentere styrken og retningen af korrelationer, bliver det langt lettere at identificere stærke eller svage sammenhænge med det samme. Dette er særligt nyttigt, når man arbejder med mange variable, da det hurtigt kan afsløre mønstre, fremhæve multikollinearitet og vejlede videre analyse.
Visualisering af korrelationsmatrix med heatmap
Først skal du oprette en korrelationsmatrix til visualisering:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Derefter kan du bruge funktionen ggcorrplot()
til at oprette et plot ud fra den:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Denne funktion har flere parametre, der kan bruges til at ændre plottets stil:
method = "square"
gør hver celle til en firkantet blok;lab = TRUE
viser korrelationsværdierne på hver blok;colors
angiver retning: rød (negativ), hvid (neutral), grøn (positiv);theme_light()
giver plottet et rent, minimalistisk udseende.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 4
Visualisering af Korrelationer med Varmekort
Stryg for at vise menuen
Korrelationsmatricer kan være svære at tolke blot ved at se på tal. Heatmaps giver en visuel metode til at se styrken og retningen af relationer mellem variable.
Hvorfor bruge et korrelations-heatmap?
Et korrelations-heatmap giver en visuel metode til at undersøge relationer mellem numeriske variable. Ved at bruge farver til at repræsentere styrken og retningen af korrelationer, bliver det langt lettere at identificere stærke eller svage sammenhænge med det samme. Dette er særligt nyttigt, når man arbejder med mange variable, da det hurtigt kan afsløre mønstre, fremhæve multikollinearitet og vejlede videre analyse.
Visualisering af korrelationsmatrix med heatmap
Først skal du oprette en korrelationsmatrix til visualisering:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Derefter kan du bruge funktionen ggcorrplot()
til at oprette et plot ud fra den:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Denne funktion har flere parametre, der kan bruges til at ændre plottets stil:
method = "square"
gør hver celle til en firkantet blok;lab = TRUE
viser korrelationsværdierne på hver blok;colors
angiver retning: rød (negativ), hvid (neutral), grøn (positiv);theme_light()
giver plottet et rent, minimalistisk udseende.
Tak for dine kommentarer!