Summary  
This chapter shows how to compute the Pearson correlation coefficient between two numerical sequences using NumPy’s corrcoef function and printing the resulting correlation value.  

General domain of usage  
Statistical data analysis

**Korrelation** är ett statistiskt mått som kvantifierar graden av samband eller relation mellan två variabler. Med andra ord hjälper det oss att förstå hur två variabler tenderar att röra sig i förhållande till varandra.

Definition

Korrelation ger ett enkelt sätt att undersöka resultatet. Korrelationsvärdet ligger inom intervallet `[-1, 1]`. Se tabellen nedan:

## Korrelation med Python

För att beräkna korrelation används funktionen `np.corrcoef()` från `numpy`, som kräver två parametrar: dataserierna för vilka korrelationen ska beräknas. Här är ett exempel:

import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv')

# Calculating correlation 
corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1]

print(corr)

Här hämtade vi värdet vid index `[0, 1]`, precis som i fallet med **kovarians**. I föregående kapitel fick vi värdet `74955.85`, och att tolka resultatet av kovariansfunktionen kan vara utmanande. I det här fallet kan vi dock dra slutsatsen att **värdena är starkt relaterade**.

Bygg en stark grund i statistik med Python. Lär dig grundläggande statistiska koncept och tillämpa dem genom NumPy och pandas. Gå från grundläggande mått som medelvärde och varians till hypotesprövning, konfidensintervall och datadrivna insikter med praktiska övningar.

Upptäck grundläggande statistiska principer, inklusive datatyper, lägesmått och viktiga skillnader mellan stickprov och populationer.

Lär dig att beräkna och tolka medelvärde, median och typvärde med Python. Öva på dessa operationer med pandas för att analysera verkliga dataset.

Förstå hur varians och standardavvikelse mäter spridningen i data. Lär dig att beräkna båda manuellt och med hjälp av Python-verktyg.

Utforska hur kovarians och korrelation beskriver relationer mellan variabler. Öva på att beräkna och jämföra båda måtten i Python.

Bemästra konfidensintervall för att uppskatta populationsparametrar. Använd NumPy, pandas och visualiseringsbibliotek för att beräkna och tolka intervall med verkliga data.

Lär dig grunderna i hypotesprövning och t-test. Förstå hur man utformar, genomför och tolkar tester med Python för att stödja datadrivna beslut.