Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Korrelaatioiden Visualisointi Lämpökartoilla | Perustason Tilastollinen Analyysi
Datan Analysointi R:llä

bookKorrelaatioiden Visualisointi Lämpökartoilla

Korrelaatiomatriisien tulkitseminen pelkkien lukujen perusteella voi olla haastavaa. Lämpökartat tarjoavat visuaalisen tavan havainnoida muuttujien välisten yhteyksien voimakkuutta ja suuntaa.

Miksi käyttää korrelaatiolämpökarttaa?

Korrelaatiolämpökartta tarjoaa visuaalisen tavan tarkastella numeeristen muuttujien välisiä suhteita. Värit kuvaavat korrelaatioiden voimakkuutta ja suuntaa, mikä helpottaa vahvojen tai heikkojen yhteyksien tunnistamista yhdellä silmäyksellä. Tämä on erityisen hyödyllistä, kun muuttujia on paljon, sillä lämpökartta paljastaa nopeasti kaavat, korostaa multikollineaarisuutta ja ohjaa jatkoanalyysia.

Korrelaatiomatriisin visualisointi lämpökartalla

Ensin tulee luoda korrelaatiomatriisi visualisointia varten:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Tämän jälkeen voidaan käyttää ggcorrplot()-funktiota kuvaajan luomiseen:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Tällä funktiolla on useita parametreja, joilla voidaan muuttaa kuvaajan tyyliä:

  • method = "square" tekee jokaisesta solusta neliön;
  • lab = TRUE näyttää korrelaatioarvot jokaisessa solussa;
  • colors ilmaisee suunnan: punainen (negatiivinen), valkoinen (neutraali), vihreä (positiivinen);
  • theme_light() antaa kuvaajalle selkeän ja pelkistetyn ulkoasun.
question mark

Mikä funktio ggcorrplot-paketista käytetään korrelaatioiden visualisointiin?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 6

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4

bookKorrelaatioiden Visualisointi Lämpökartoilla

Pyyhkäise näyttääksesi valikon

Korrelaatiomatriisien tulkitseminen pelkkien lukujen perusteella voi olla haastavaa. Lämpökartat tarjoavat visuaalisen tavan havainnoida muuttujien välisten yhteyksien voimakkuutta ja suuntaa.

Miksi käyttää korrelaatiolämpökarttaa?

Korrelaatiolämpökartta tarjoaa visuaalisen tavan tarkastella numeeristen muuttujien välisiä suhteita. Värit kuvaavat korrelaatioiden voimakkuutta ja suuntaa, mikä helpottaa vahvojen tai heikkojen yhteyksien tunnistamista yhdellä silmäyksellä. Tämä on erityisen hyödyllistä, kun muuttujia on paljon, sillä lämpökartta paljastaa nopeasti kaavat, korostaa multikollineaarisuutta ja ohjaa jatkoanalyysia.

Korrelaatiomatriisin visualisointi lämpökartalla

Ensin tulee luoda korrelaatiomatriisi visualisointia varten:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Tämän jälkeen voidaan käyttää ggcorrplot()-funktiota kuvaajan luomiseen:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Tällä funktiolla on useita parametreja, joilla voidaan muuttaa kuvaajan tyyliä:

  • method = "square" tekee jokaisesta solusta neliön;
  • lab = TRUE näyttää korrelaatioarvot jokaisessa solussa;
  • colors ilmaisee suunnan: punainen (negatiivinen), valkoinen (neutraali), vihreä (positiivinen);
  • theme_light() antaa kuvaajalle selkeän ja pelkistetyn ulkoasun.
question mark

Mikä funktio ggcorrplot-paketista käytetään korrelaatioiden visualisointiin?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 6
some-alt