Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Kovarians | Kovarians vs Korrelation
Lær Statistik med Python

bookKovarians

Note
Definition

Kovarians er et mål for den fælles variabilitet mellem to stokastiske variable.

Formlerne for stickprøve og population kovarians adskiller sig, men de vil ikke blive gennemgået i detaljer her. Dette kapitel fokuserer på kovarianserne for følgende datasæt:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Beregning af kovarians med Python

For at beregne kovarians i Python, anvend funktionen np.cov() fra NumPy-biblioteket. Den tager to parametre: dataserierne, som du ønsker at beregne kovariansen for.

Resultatet findes ved indeks [0,1]. Dette kursus dækker ikke de øvrige værdier i outputtet, se eksemplet:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Dette indikerer, at værdierne bevæger sig i samme retning. Dette er logisk, da et større butiksareal svarer til et større antal varer. En væsentlig ulempe ved kovarians er, at værdien kan være uendelig.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain what the other values in the np.cov() output mean?

How do I interpret the sign and magnitude of the covariance value?

Can you show how to calculate covariance for other pairs of columns in the dataset?

Awesome!

Completion rate improved to 2.63

bookKovarians

Stryg for at vise menuen

Note
Definition

Kovarians er et mål for den fælles variabilitet mellem to stokastiske variable.

Formlerne for stickprøve og population kovarians adskiller sig, men de vil ikke blive gennemgået i detaljer her. Dette kapitel fokuserer på kovarianserne for følgende datasæt:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Beregning af kovarians med Python

For at beregne kovarians i Python, anvend funktionen np.cov() fra NumPy-biblioteket. Den tager to parametre: dataserierne, som du ønsker at beregne kovariansen for.

Resultatet findes ved indeks [0,1]. Dette kursus dækker ikke de øvrige værdier i outputtet, se eksemplet:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Dette indikerer, at værdierne bevæger sig i samme retning. Dette er logisk, da et større butiksareal svarer til et større antal varer. En væsentlig ulempe ved kovarians er, at værdien kan være uendelig.

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1
some-alt