Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Korrelation | Kovarians vs Korrelation
Statistik med Python

bookKorrelation

Stryg for at vise menuen

Note
Definition

Korrelation er et statistisk mål, der kvantificerer graden af sammenhæng eller relation mellem to variable. Med andre ord hjælper det os med at forstå, hvordan to variable har tendens til at bevæge sig i forhold til hinanden.

Korrelation giver en enkel måde at undersøge resultatet på. Korrelationsværdien ligger inden for intervallet [-1, 1]. Se tabellen nedenfor:

Korrelation med Python

For at beregne korrelation anvendes funktionen np.corrcoef() fra numpy, som kræver to parametre: dataserierne, hvor korrelationen skal beregnes. Eksempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Her udtrækker vi værdien ved indeks [0, 1], ligesom i tilfældet med kovarians. I det forrige kapitel opnåede vi værdien 74955.85, og det kan være udfordrende at fortolke resultatet af kovariansfunktionen. I dette tilfælde kan vi dog konkludere, at værdierne er stærkt relaterede.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 2

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 4. Kapitel 2
some-alt