Visualisering af Korrelationer med Heatmaps
Korrelationsmatricer kan være svære at tolke blot ved at se på tal. Heatmaps giver en visuel metode til at se styrken og retningen af relationer mellem variable.
Hvorfor bruge et korrelations-heatmap?
Et korrelations-heatmap giver en visuel metode til at undersøge relationer mellem numeriske variable. Ved at bruge farver til at repræsentere styrken og retningen af korrelationer, bliver det langt nemmere hurtigt at identificere stærke eller svage sammenhænge. Dette er særligt nyttigt, når man arbejder med mange variable, da det hurtigt kan afsløre mønstre, fremhæve multikollinearitet og vejlede videre analyse.
Visualisering af korrelationsmatrix med heatmap
Først skal du oprette en korrelationsmatrix til visualisering:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Derefter kan du bruge funktionen ggcorrplot()
til at oprette et plot ud fra den:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Denne funktion har flere parametre, der kan bruges til at ændre plottets stil:
method = "square"
gør hver celle til et kvadratisk blok;lab = TRUE
viser korrelationsværdierne oven på hver blok;colors
angiver retning: rød (negativ), hvid (neutral), grøn (positiv);theme_light()
giver plottet et rent, minimalistisk udtryk.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 4
Visualisering af Korrelationer med Heatmaps
Stryg for at vise menuen
Korrelationsmatricer kan være svære at tolke blot ved at se på tal. Heatmaps giver en visuel metode til at se styrken og retningen af relationer mellem variable.
Hvorfor bruge et korrelations-heatmap?
Et korrelations-heatmap giver en visuel metode til at undersøge relationer mellem numeriske variable. Ved at bruge farver til at repræsentere styrken og retningen af korrelationer, bliver det langt nemmere hurtigt at identificere stærke eller svage sammenhænge. Dette er særligt nyttigt, når man arbejder med mange variable, da det hurtigt kan afsløre mønstre, fremhæve multikollinearitet og vejlede videre analyse.
Visualisering af korrelationsmatrix med heatmap
Først skal du oprette en korrelationsmatrix til visualisering:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Derefter kan du bruge funktionen ggcorrplot()
til at oprette et plot ud fra den:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Denne funktion har flere parametre, der kan bruges til at ændre plottets stil:
method = "square"
gør hver celle til et kvadratisk blok;lab = TRUE
viser korrelationsværdierne oven på hver blok;colors
angiver retning: rød (negativ), hvid (neutral), grøn (positiv);theme_light()
giver plottet et rent, minimalistisk udtryk.
Tak for dine kommentarer!