Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Korrelasjon | Kovarians vs. Korrelasjon
Lære Statistikk med Python

bookKorrelasjon

Korrelasjon er et statistisk mål som kvantifiserer graden av sammenheng eller relasjon mellom to variabler. Med andre ord hjelper det oss å forstå hvordan to variabler har en tendens til å bevege seg i forhold til hverandre.

Korrelasjon gir en enkel måte å undersøke resultatet på. Korrelasjonsverdien ligger innenfor området [-1, 1]. Se tabellen nedenfor:

Korrelasjon med Python

For å beregne korrelasjon, bruk funksjonen np.corrcoef() fra numpy, som krever to parametere: dataseriene det skal beregnes korrelasjon for. Her er et eksempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Her hentet vi ut verdien på indeks [0, 1], akkurat som i tilfellet med kovarians. I forrige kapittel fikk vi verdien 74955.85, og å tolke resultatet fra kovariasjonsfunksjonen kan være utfordrende. I dette tilfellet kan vi derimot konkludere med at verdiene er sterkt relatert.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 2

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 2.63

bookKorrelasjon

Sveip for å vise menyen

Korrelasjon er et statistisk mål som kvantifiserer graden av sammenheng eller relasjon mellom to variabler. Med andre ord hjelper det oss å forstå hvordan to variabler har en tendens til å bevege seg i forhold til hverandre.

Korrelasjon gir en enkel måte å undersøke resultatet på. Korrelasjonsverdien ligger innenfor området [-1, 1]. Se tabellen nedenfor:

Korrelasjon med Python

For å beregne korrelasjon, bruk funksjonen np.corrcoef() fra numpy, som krever to parametere: dataseriene det skal beregnes korrelasjon for. Her er et eksempel:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
copy

Her hentet vi ut verdien på indeks [0, 1], akkurat som i tilfellet med kovarians. I forrige kapittel fikk vi verdien 74955.85, og å tolke resultatet fra kovariasjonsfunksjonen kan være utfordrende. I dette tilfellet kan vi derimot konkludere med at verdiene er sterkt relatert.

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 2
some-alt