Kursusindhold
Lær Statistik med Python
Lær Statistik med Python
Kovarians
Kovarians er et mål for den fælles variabilitet mellem to stokastiske variable.
Formlerne for stickprøve og population kovarians adskiller sig, men de vil ikke blive gennemgået i detaljer her. Dette kapitel fokuserer på kovariansen for følgende datasæt:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Beregning af kovarians med Python
For at beregne kovarians i Python, brug funktionen np.cov()
fra NumPy-biblioteket. Den tager to parametre: dataserierne, som du ønsker at beregne kovariansen for.
Resultatet findes ved indeks [0,1]
. Dette kursus dækker ikke de øvrige værdier i outputtet, se eksemplet:
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Dette indikerer, at værdierne bevæger sig i samme retning. Det giver mening, da et større butiksareal svarer til et større antal varer. En væsentlig ulempe ved kovarians er, at værdien kan være uendelig.
Tak for dine kommentarer!