Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Korrelation | Kovarians vs Korrelation
Lær Statistik med Python

bookKorrelation

Note
Definition

Korrelation er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.

Korrelation giver en enkel måde at undersøge resultatet på. Korrelationsværdien ligger inden for intervallet [-1, 1]. Se tabellen nedenfor:

Korrelation med Python

For at beregne korrelation anvendes funktionen np.corrcoef() fra numpy, som kræver to parametre: dataserierne, hvorpå korrelationen skal beregnes. Her er et eksempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Her udtrækker vi værdien ved indeks [0, 1], ligesom i tilfældet med kovarians. I det foregående kapitel opnåede vi værdien 74955.85, og tolkningen af resultatet fra kovariansfunktionen kan være udfordrende. I dette tilfælde kan vi dog konkludere, at værdierne er stærkt relaterede.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 2.63

bookKorrelation

Stryg for at vise menuen

Note
Definition

Korrelation er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.

Korrelation giver en enkel måde at undersøge resultatet på. Korrelationsværdien ligger inden for intervallet [-1, 1]. Se tabellen nedenfor:

Korrelation med Python

For at beregne korrelation anvendes funktionen np.corrcoef() fra numpy, som kræver to parametre: dataserierne, hvorpå korrelationen skal beregnes. Her er et eksempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Her udtrækker vi værdien ved indeks [0, 1], ligesom i tilfældet med kovarians. I det foregående kapitel opnåede vi værdien 74955.85, og tolkningen af resultatet fra kovariansfunktionen kan være udfordrende. I dette tilfælde kan vi dog konkludere, at værdierne er stærkt relaterede.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2
some-alt