Korrelaatioiden Visualisointi Lämpökartoilla
Korrelaatiomatriisien tulkitseminen pelkkien lukujen perusteella voi olla haastavaa. Lämpökartat tarjoavat visuaalisen tavan havainnoida muuttujien välisten yhteyksien voimakkuutta ja suuntaa.
Miksi käyttää korrelaatiolämpökarttaa?
Korrelaatiolämpökartta tarjoaa visuaalisen tavan tarkastella numeeristen muuttujien välisiä suhteita. Värit kuvaavat korrelaatioiden voimakkuutta ja suuntaa, mikä helpottaa vahvojen tai heikkojen yhteyksien tunnistamista yhdellä silmäyksellä. Tämä on erityisen hyödyllistä, kun muuttujia on paljon, sillä lämpökartta paljastaa nopeasti kaavat, korostaa multikollineaarisuutta ja ohjaa jatkoanalyysia.
Korrelaatiomatriisin visualisointi lämpökartalla
Ensin tulee luoda korrelaatiomatriisi visualisointia varten:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Tämän jälkeen voidaan käyttää ggcorrplot()
-funktiota kuvaajan luomiseen:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Tällä funktiolla on useita parametreja, joilla voidaan muuttaa kuvaajan tyyliä:
method = "square"
tekee jokaisesta solusta neliön;lab = TRUE
näyttää korrelaatioarvot jokaisessa solussa;colors
ilmaisee suunnan: punainen (negatiivinen), valkoinen (neutraali), vihreä (positiivinen);theme_light()
antaa kuvaajalle selkeän ja pelkistetyn ulkoasun.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4
Korrelaatioiden Visualisointi Lämpökartoilla
Pyyhkäise näyttääksesi valikon
Korrelaatiomatriisien tulkitseminen pelkkien lukujen perusteella voi olla haastavaa. Lämpökartat tarjoavat visuaalisen tavan havainnoida muuttujien välisten yhteyksien voimakkuutta ja suuntaa.
Miksi käyttää korrelaatiolämpökarttaa?
Korrelaatiolämpökartta tarjoaa visuaalisen tavan tarkastella numeeristen muuttujien välisiä suhteita. Värit kuvaavat korrelaatioiden voimakkuutta ja suuntaa, mikä helpottaa vahvojen tai heikkojen yhteyksien tunnistamista yhdellä silmäyksellä. Tämä on erityisen hyödyllistä, kun muuttujia on paljon, sillä lämpökartta paljastaa nopeasti kaavat, korostaa multikollineaarisuutta ja ohjaa jatkoanalyysia.
Korrelaatiomatriisin visualisointi lämpökartalla
Ensin tulee luoda korrelaatiomatriisi visualisointia varten:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Tämän jälkeen voidaan käyttää ggcorrplot()
-funktiota kuvaajan luomiseen:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Tällä funktiolla on useita parametreja, joilla voidaan muuttaa kuvaajan tyyliä:
method = "square"
tekee jokaisesta solusta neliön;lab = TRUE
näyttää korrelaatioarvot jokaisessa solussa;colors
ilmaisee suunnan: punainen (negatiivinen), valkoinen (neutraali), vihreä (positiivinen);theme_light()
antaa kuvaajalle selkeän ja pelkistetyn ulkoasun.
Kiitos palautteestasi!