Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Korrelation | Kovarians vs Korrelation
Lära Sig Statistik med Python

bookKorrelation

Note
Definition

Korrelation är ett statistiskt mått som kvantifierar graden av samband eller relation mellan två variabler. Med andra ord hjälper det oss att förstå hur två variabler tenderar att röra sig i förhållande till varandra.

Korrelation ger ett enkelt sätt att undersöka resultatet. Korrelationsvärdet ligger inom intervallet [-1, 1]. Se tabellen nedan:

Korrelation med Python

För att beräkna korrelation används funktionen np.corrcoef() från numpy, som kräver två parametrar: datasekvenserna för vilka korrelationen ska beräknas. Här är ett exempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Här hämtade vi värdet vid index [0, 1], precis som i fallet med kovarians. I föregående kapitel fick vi värdet 74955.85, och att tolka resultatet från kovariansfunktionen kan vara utmanande. I det här fallet kan vi dock dra slutsatsen att värdena är starkt relaterade.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 2

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

What does a correlation value close to 1 or -1 indicate in practice?

Can you explain the difference between correlation and covariance?

How should I interpret the correlation value obtained from the code example?

Awesome!

Completion rate improved to 2.63

bookKorrelation

Svep för att visa menyn

Note
Definition

Korrelation är ett statistiskt mått som kvantifierar graden av samband eller relation mellan två variabler. Med andra ord hjälper det oss att förstå hur två variabler tenderar att röra sig i förhållande till varandra.

Korrelation ger ett enkelt sätt att undersöka resultatet. Korrelationsvärdet ligger inom intervallet [-1, 1]. Se tabellen nedan:

Korrelation med Python

För att beräkna korrelation används funktionen np.corrcoef() från numpy, som kräver två parametrar: datasekvenserna för vilka korrelationen ska beräknas. Här är ett exempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Här hämtade vi värdet vid index [0, 1], precis som i fallet med kovarians. I föregående kapitel fick vi värdet 74955.85, och att tolka resultatet från kovariansfunktionen kan vara utmanande. I det här fallet kan vi dock dra slutsatsen att värdena är starkt relaterade.

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 2
some-alt