Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Korrelaatioanalyysi | Perustason Tilastollinen Analyysi
Datan analysointi R:llä

bookKorrelaatioanalyysi

Korrelaatioanalyysi on tilastollinen menetelmä, jolla mitataan kahden numeerisen muuttujan välisen suhteen voimakkuutta ja suuntaa. Sen avulla voidaan ymmärtää, miten yhden muuttujan muutokset liittyvät toisen muuttujan muutoksiin.

Mitä on korrelaatio?

Korrelaatiokerroin (yleensä merkittynä rr) vaihtelee välillä -1 ja 1 ja tarkoittaa:

  • 1: täydellinen positiivinen korrelaatio;
  • 0: ei korrelaatiota;
  • −1: täydellinen negatiivinen korrelaatio.

Korrelaatiomenetelmiä on useita, mutta Pearsonin korrelaatio on yleisimmin käytetty numeeriselle jatkuvalle datalle R:ssä.

Korrelaatio kahden muuttujan välillä

cor()-funktiolla voidaan laskea kahden muuttujan välinen korrelaatiokerroin. Tarvitset vain kaksi saraketta parametreiksi.

cor(df$selling_price, df$km_driven)

Funktio palauttaa arvon väliltä -1 ja 1.

Korrelaatiomatriisi (useita muuttujia)

Samaa funktiota voidaan käyttää tarkastelemaan useiden muuttujien välisiä suhteita.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Tulos tallennetaan matriisina, joka näyttää valittujen numeeristen muuttujien väliset parittaiset korrelaatioarvot.

question mark

Korrelaatiokerroin -0.9 tarkoittaa:

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 5

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between positive and negative correlation with more examples?

How do I interpret the values in a correlation matrix?

What should I do if my data contains non-numeric columns or missing values?

Awesome!

Completion rate improved to 4

bookKorrelaatioanalyysi

Pyyhkäise näyttääksesi valikon

Korrelaatioanalyysi on tilastollinen menetelmä, jolla mitataan kahden numeerisen muuttujan välisen suhteen voimakkuutta ja suuntaa. Sen avulla voidaan ymmärtää, miten yhden muuttujan muutokset liittyvät toisen muuttujan muutoksiin.

Mitä on korrelaatio?

Korrelaatiokerroin (yleensä merkittynä rr) vaihtelee välillä -1 ja 1 ja tarkoittaa:

  • 1: täydellinen positiivinen korrelaatio;
  • 0: ei korrelaatiota;
  • −1: täydellinen negatiivinen korrelaatio.

Korrelaatiomenetelmiä on useita, mutta Pearsonin korrelaatio on yleisimmin käytetty numeeriselle jatkuvalle datalle R:ssä.

Korrelaatio kahden muuttujan välillä

cor()-funktiolla voidaan laskea kahden muuttujan välinen korrelaatiokerroin. Tarvitset vain kaksi saraketta parametreiksi.

cor(df$selling_price, df$km_driven)

Funktio palauttaa arvon väliltä -1 ja 1.

Korrelaatiomatriisi (useita muuttujia)

Samaa funktiota voidaan käyttää tarkastelemaan useiden muuttujien välisiä suhteita.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Tulos tallennetaan matriisina, joka näyttää valittujen numeeristen muuttujien väliset parittaiset korrelaatioarvot.

question mark

Korrelaatiokerroin -0.9 tarkoittaa:

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 5
some-alt