Korrelation
Korrelation er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.
Korrelation giver en enkel måde at undersøge resultatet på. Korrelationsværdien ligger inden for intervallet [-1, 1]
. Se tabellen nedenfor:
Korrelation med Python
For at beregne korrelation anvendes funktionen np.corrcoef()
fra numpy
, som kræver to parametre: dataserierne, hvorpå korrelationen skal beregnes. Her er et eksempel:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Her udtrækker vi værdien ved indeks [0, 1]
, ligesom i tilfældet med kovarians. I det foregående kapitel opnåede vi værdien 74955.85
, og tolkningen af resultatet fra kovariansfunktionen kan være udfordrende. I dette tilfælde kan vi dog konkludere, at værdierne er stærkt relaterede.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 2.63
Korrelation
Stryg for at vise menuen
Korrelation er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.
Korrelation giver en enkel måde at undersøge resultatet på. Korrelationsværdien ligger inden for intervallet [-1, 1]
. Se tabellen nedenfor:
Korrelation med Python
For at beregne korrelation anvendes funktionen np.corrcoef()
fra numpy
, som kræver to parametre: dataserierne, hvorpå korrelationen skal beregnes. Her er et eksempel:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Her udtrækker vi værdien ved indeks [0, 1]
, ligesom i tilfældet med kovarians. I det foregående kapitel opnåede vi værdien 74955.85
, og tolkningen af resultatet fra kovariansfunktionen kan være udfordrende. I dette tilfælde kan vi dog konkludere, at værdierne er stærkt relaterede.
Tak for dine kommentarer!