Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Korrelation | Kovarians vs Korrelation
Lära Sig Statistik med Python
course content

Kursinnehåll

Lära Sig Statistik med Python

Lära Sig Statistik med Python

1. Grundläggande Begrepp
2. Medelvärde, Median och Typvärde med Python
3. Varians och Standardavvikelse
4. Kovarians vs Korrelation
5. Konfidensintervall
6. Statistisk Testning

book
Korrelation

Korrelation är ett statistiskt mått som kvantifierar graden av samband eller relation mellan två variabler. Med andra ord hjälper det oss att förstå hur två variabler tenderar att röra sig i förhållande till varandra.

Korrelation ger ett enkelt sätt att undersöka resultatet. Korrelationens värde ligger inom intervallet [-1, 1]. Se tabellen nedan:

Korrelation med Python

För att beräkna korrelation används funktionen np.corrcoef() från numpy, som kräver två parametrar: dataserierna för vilka korrelationen ska beräknas. Här är ett exempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Här hämtade vi värdet vid index [0, 1], precis som i fallet med kovarians. I föregående kapitel fick vi värdet 74955.85, och att tolka resultatet från kovariansfunktionen kan vara utmanande. I det här fallet kan vi dock dra slutsatsen att värdena är starkt relaterade.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 2

Fråga AI

expand
ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

course content

Kursinnehåll

Lära Sig Statistik med Python

Lära Sig Statistik med Python

1. Grundläggande Begrepp
2. Medelvärde, Median och Typvärde med Python
3. Varians och Standardavvikelse
4. Kovarians vs Korrelation
5. Konfidensintervall
6. Statistisk Testning

book
Korrelation

Korrelation är ett statistiskt mått som kvantifierar graden av samband eller relation mellan två variabler. Med andra ord hjälper det oss att förstå hur två variabler tenderar att röra sig i förhållande till varandra.

Korrelation ger ett enkelt sätt att undersöka resultatet. Korrelationens värde ligger inom intervallet [-1, 1]. Se tabellen nedan:

Korrelation med Python

För att beräkna korrelation används funktionen np.corrcoef() från numpy, som kräver två parametrar: dataserierna för vilka korrelationen ska beräknas. Här är ett exempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Här hämtade vi värdet vid index [0, 1], precis som i fallet med kovarians. I föregående kapitel fick vi värdet 74955.85, och att tolka resultatet från kovariansfunktionen kan vara utmanande. I det här fallet kan vi dock dra slutsatsen att värdena är starkt relaterade.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 2
Vi beklagar att något gick fel. Vad hände?
some-alt