Kovarians
Kovarians er et mål for den fælles variabilitet mellem to stokastiske variable.
Formlerne for stickprøve og population kovarians adskiller sig, men de vil ikke blive gennemgået i detaljer her. Dette kapitel fokuserer på kovariansen for følgende datasæt:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Beregning af kovarians med Python
For at beregne kovarians i Python, brug funktionen np.cov()
fra NumPy-biblioteket. Den tager to parametre: dataserierne, som du ønsker at beregne kovariansen for.
Resultatet findes ved indeks [0,1]
. Dette kursus dækker ikke de øvrige værdier i outputtet, se eksemplet:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Dette indikerer, at værdierne bevæger sig i samme retning. Det giver mening, da et større butiksareal svarer til et større antal varer. En væsentlig ulempe ved kovarians er, at værdien kan være uendelig.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 2.63
Kovarians
Stryg for at vise menuen
Kovarians er et mål for den fælles variabilitet mellem to stokastiske variable.
Formlerne for stickprøve og population kovarians adskiller sig, men de vil ikke blive gennemgået i detaljer her. Dette kapitel fokuserer på kovariansen for følgende datasæt:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Beregning af kovarians med Python
For at beregne kovarians i Python, brug funktionen np.cov()
fra NumPy-biblioteket. Den tager to parametre: dataserierne, som du ønsker at beregne kovariansen for.
Resultatet findes ved indeks [0,1]
. Dette kursus dækker ikke de øvrige værdier i outputtet, se eksemplet:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Dette indikerer, at værdierne bevæger sig i samme retning. Det giver mening, da et større butiksareal svarer til et større antal varer. En væsentlig ulempe ved kovarians er, at værdien kan være uendelig.
Tak for dine kommentarer!