Summary  
This chapter shows how to compute the Pearson correlation coefficient between two numerical sequences using NumPy’s corrcoef function and printing the resulting correlation value.  

General domain of usage  
Statistical data analysis

**Korrelation** er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.

Definition

Korrelation giver en enkel måde at undersøge resultatet på. Korrelationsværdien ligger inden for intervallet `[-1, 1]`. Se tabellen nedenfor:

## Korrelation med Python

For at beregne korrelation anvendes funktionen `np.corrcoef()` fra `numpy`, som kræver to parametre: dataserierne, hvor korrelationen skal beregnes. Eksempel:

import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv')

# Calculating correlation 
corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1]

print(corr)

Her udtrækker vi værdien ved indeks `[0, 1]`, ligesom i tilfældet med **kovarians**. I det forrige kapitel opnåede vi værdien `74955.85`, og det kan være udfordrende at fortolke resultatet af kovariansfunktionen. I dette tilfælde kan vi dog konkludere, at **værdierne er stærkt relaterede**.

Opbyg et solidt fundament i statistik ved hjælp af Python. Lær essentielle statistiske begreber og anvend dem gennem NumPy og pandas. Gå fra grundlæggende mål som gennemsnit og varians til hypotesetest, konfidensintervaller og datadrevne indsigter med praktiske øvelser.

Opdag grundlæggende statistiske principper, herunder datatyper, mål for central tendens og væsentlige forskelle mellem stikprøver og populationer.

Lær at beregne og fortolke gennemsnit, median og typetal ved hjælp af Python. Øv disse operationer med pandas for at analysere virkelige datasæt.

Forstå hvordan varians og standardafvigelse måler dataspredning. Lær at beregne begge dele manuelt og ved hjælp af Python-værktøjer.

Undersøg, hvordan kovarians og korrelation beskriver relationer mellem variable. Øv dig i at beregne og sammenligne begge metrikker i Python.

Behersk konfidensintervaller til at estimere populationsparametre. Brug NumPy, pandas og visualiseringsbiblioteker til at beregne og fortolke intervaller med virkelige data.

Lær det grundlæggende i hypoteseafprøvning og t-testen. Forstå, hvordan man designer, udfører og fortolker tests ved hjælp af Python til at understøtte datadrevne beslutninger.