Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Korrelaatioiden Visualisointi Lämpökartoilla | Perustason Tilastollinen Analyysi
Datan analysointi R:llä

bookKorrelaatioiden Visualisointi Lämpökartoilla

Korrelaatiomatriisien tulkitseminen pelkkien lukujen perusteella voi olla haastavaa. Lämpökartat tarjoavat visuaalisen tavan nähdä muuttujien välisten yhteyksien voimakkuus ja suunta.

Miksi käyttää korrelaatiolämpökarttaa?

Korrelaatiolämpökartta tarjoaa visuaalisen tavan tarkastella numeeristen muuttujien välisiä suhteita. Värit kuvaavat korrelaatioiden voimakkuutta ja suuntaa, jolloin vahvat tai heikot yhteydet on helppo havaita yhdellä silmäyksellä. Tämä on erityisen hyödyllistä, kun muuttujia on paljon, sillä lämpökartta paljastaa nopeasti kaavat, korostaa multikollineaarisuutta ja ohjaa jatkoanalyysia.

Korrelaatiomatriisin visualisointi lämpökartalla

Ensin tulee luoda korrelaatiomatriisi visualisointia varten:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Tämän jälkeen voit käyttää ggcorrplot()-funktiota piirtääksesi kuvaajan:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Tällä funktiolla on useita parametreja, joilla voit muuttaa kuvaajan tyyliä:

  • method = "square" tekee jokaisesta solusta neliön;
  • lab = TRUE näyttää korrelaatioarvot jokaisessa solussa;
  • colors ilmaisee suunnan: punainen (negatiivinen), valkoinen (neutraali), vihreä (positiivinen);
  • theme_light() antaa kuvaajalle selkeän ja pelkistetyn ulkoasun.
question mark

Mitä funktiota käytetään ggcorrplot-paketista korrelaatioiden visualisointiin?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 6

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What do the different colors in the heatmap represent?

How can I interpret the values shown on the heatmap?

Can I customize the appearance of the correlation heatmap further?

Awesome!

Completion rate improved to 4

bookKorrelaatioiden Visualisointi Lämpökartoilla

Pyyhkäise näyttääksesi valikon

Korrelaatiomatriisien tulkitseminen pelkkien lukujen perusteella voi olla haastavaa. Lämpökartat tarjoavat visuaalisen tavan nähdä muuttujien välisten yhteyksien voimakkuus ja suunta.

Miksi käyttää korrelaatiolämpökarttaa?

Korrelaatiolämpökartta tarjoaa visuaalisen tavan tarkastella numeeristen muuttujien välisiä suhteita. Värit kuvaavat korrelaatioiden voimakkuutta ja suuntaa, jolloin vahvat tai heikot yhteydet on helppo havaita yhdellä silmäyksellä. Tämä on erityisen hyödyllistä, kun muuttujia on paljon, sillä lämpökartta paljastaa nopeasti kaavat, korostaa multikollineaarisuutta ja ohjaa jatkoanalyysia.

Korrelaatiomatriisin visualisointi lämpökartalla

Ensin tulee luoda korrelaatiomatriisi visualisointia varten:

# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")

Tämän jälkeen voit käyttää ggcorrplot()-funktiota piirtääksesi kuvaajan:

ggcorrplot(cor_matrix,
           method = "square",
           type = "full",
           lab = TRUE,
           lab_size = 5,
           colors = c("red", "white", "forestgreen"),
           title = "Correlation Heatmap",
           ggtheme = ggplot2::theme_light())

Tällä funktiolla on useita parametreja, joilla voit muuttaa kuvaajan tyyliä:

  • method = "square" tekee jokaisesta solusta neliön;
  • lab = TRUE näyttää korrelaatioarvot jokaisessa solussa;
  • colors ilmaisee suunnan: punainen (negatiivinen), valkoinen (neutraali), vihreä (positiivinen);
  • theme_light() antaa kuvaajalle selkeän ja pelkistetyn ulkoasun.
question mark

Mitä funktiota käytetään ggcorrplot-paketista korrelaatioiden visualisointiin?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 6
some-alt