Korrelaatio
Korrelaatio on tilastollinen mittari, joka kuvaa kahden muuttujan välisen yhteyden tai riippuvuuden astetta. Toisin sanoen se auttaa ymmärtämään, miten kaksi muuttujaa taipuvat muuttumaan suhteessa toisiinsa.
Korrelaatio tarjoaa yksinkertaisen tavan tarkastella tulosta. Korrelaation arvo sijoittuu välille [-1, 1]. Katso alla oleva taulukko:
Korrelaatio Pythonilla
Korrelaation laskemiseen käytetään np.corrcoef()-kirjaston numpy-funktiota, joka vaatii kaksi parametria: tietojonot, joiden välinen korrelaatio halutaan laskea. Tässä esimerkki:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Tässä poimittiin arvo indeksistä [0, 1], aivan kuten kovarianssin tapauksessa. Edellisessä luvussa saimme arvon 74955.85, ja kovarianssifunktion tuloksen tulkinta voi olla haastavaa. Tässä tapauksessa voidaan kuitenkin todeta, että arvot ovat vahvasti yhteydessä toisiinsa.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
What does a correlation value close to 1 or -1 mean in practical terms?
Can you explain the difference between correlation and covariance?
How should I interpret the correlation result from the code example?
Awesome!
Completion rate improved to 2.63
Korrelaatio
Pyyhkäise näyttääksesi valikon
Korrelaatio on tilastollinen mittari, joka kuvaa kahden muuttujan välisen yhteyden tai riippuvuuden astetta. Toisin sanoen se auttaa ymmärtämään, miten kaksi muuttujaa taipuvat muuttumaan suhteessa toisiinsa.
Korrelaatio tarjoaa yksinkertaisen tavan tarkastella tulosta. Korrelaation arvo sijoittuu välille [-1, 1]. Katso alla oleva taulukko:
Korrelaatio Pythonilla
Korrelaation laskemiseen käytetään np.corrcoef()-kirjaston numpy-funktiota, joka vaatii kaksi parametria: tietojonot, joiden välinen korrelaatio halutaan laskea. Tässä esimerkki:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Tässä poimittiin arvo indeksistä [0, 1], aivan kuten kovarianssin tapauksessa. Edellisessä luvussa saimme arvon 74955.85, ja kovarianssifunktion tuloksen tulkinta voi olla haastavaa. Tässä tapauksessa voidaan kuitenkin todeta, että arvot ovat vahvasti yhteydessä toisiinsa.
Kiitos palautteestasi!