Korrelaatioanalyysi
Korrelaatioanalyysi on tilastollinen menetelmä, jolla mitataan kahden numeerisen muuttujan välisen suhteen voimakkuutta ja suuntaa. Sen avulla voidaan ymmärtää, miten yhden muuttujan muutokset liittyvät toisen muuttujan muutoksiin.
Mitä on korrelaatio?
Korrelaatiokerroin (yleensä merkittynä r) vaihtelee välillä -1 ja 1 ja tarkoittaa:
- 1: täydellinen positiivinen korrelaatio;
- 0: ei korrelaatiota;
- −1: täydellinen negatiivinen korrelaatio.
Korrelaatiomenetelmiä on useita, mutta Pearsonin korrelaatio on yleisimmin käytetty numeeriselle jatkuvalle datalle R:ssä.
Korrelaatio kahden muuttujan välillä
Voit käyttää cor()
-funktiota laskeaksesi korrelaatiokertoimen kahden muuttujan välillä. Tarvitset vain kaksi saraketta parametreiksi.
cor(df$selling_price, df$km_driven)
Tämän seurauksena funktio palauttaa arvon väliltä -1 ja 1.
Korrelaatiomatriisi (useita muuttujia)
Samaa funktiota voidaan käyttää tarkastelemaan useiden muuttujien välisiä suhteita.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Tulos tallennetaan matriisina, joka näyttää valittujen numeeristen muuttujien väliset parittaiset korrelaatioarvot.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4
Korrelaatioanalyysi
Pyyhkäise näyttääksesi valikon
Korrelaatioanalyysi on tilastollinen menetelmä, jolla mitataan kahden numeerisen muuttujan välisen suhteen voimakkuutta ja suuntaa. Sen avulla voidaan ymmärtää, miten yhden muuttujan muutokset liittyvät toisen muuttujan muutoksiin.
Mitä on korrelaatio?
Korrelaatiokerroin (yleensä merkittynä r) vaihtelee välillä -1 ja 1 ja tarkoittaa:
- 1: täydellinen positiivinen korrelaatio;
- 0: ei korrelaatiota;
- −1: täydellinen negatiivinen korrelaatio.
Korrelaatiomenetelmiä on useita, mutta Pearsonin korrelaatio on yleisimmin käytetty numeeriselle jatkuvalle datalle R:ssä.
Korrelaatio kahden muuttujan välillä
Voit käyttää cor()
-funktiota laskeaksesi korrelaatiokertoimen kahden muuttujan välillä. Tarvitset vain kaksi saraketta parametreiksi.
cor(df$selling_price, df$km_driven)
Tämän seurauksena funktio palauttaa arvon väliltä -1 ja 1.
Korrelaatiomatriisi (useita muuttujia)
Samaa funktiota voidaan käyttää tarkastelemaan useiden muuttujien välisiä suhteita.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Tulos tallennetaan matriisina, joka näyttää valittujen numeeristen muuttujien väliset parittaiset korrelaatioarvot.
Kiitos palautteestasi!