Kovarians
Kovarians er et mål for den fælles variabilitet mellem to stokastiske variable.
Formlerne for stickprøve og population kovarians adskiller sig, men de vil ikke blive gennemgået i detaljer her. Dette kapitel fokuserer på kovarianserne for følgende datasæt:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Beregning af kovarians med Python
For at beregne kovarians i Python, anvend funktionen np.cov()
fra NumPy-biblioteket. Den tager to parametre: dataserierne, som du ønsker at beregne kovariansen for.
Resultatet findes ved indeks [0,1]
. Dette kursus dækker ikke de øvrige værdier i outputtet, se eksemplet:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Dette indikerer, at værdierne bevæger sig i samme retning. Dette er logisk, da et større butiksareal svarer til et større antal varer. En væsentlig ulempe ved kovarians er, at værdien kan være uendelig.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you explain what the other values in the np.cov() output mean?
How do I interpret the sign and magnitude of the covariance value?
Can you show how to calculate covariance for other pairs of columns in the dataset?
Awesome!
Completion rate improved to 2.63
Kovarians
Stryg for at vise menuen
Kovarians er et mål for den fælles variabilitet mellem to stokastiske variable.
Formlerne for stickprøve og population kovarians adskiller sig, men de vil ikke blive gennemgået i detaljer her. Dette kapitel fokuserer på kovarianserne for følgende datasæt:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Beregning af kovarians med Python
For at beregne kovarians i Python, anvend funktionen np.cov()
fra NumPy-biblioteket. Den tager to parametre: dataserierne, som du ønsker at beregne kovariansen for.
Resultatet findes ved indeks [0,1]
. Dette kursus dækker ikke de øvrige værdier i outputtet, se eksemplet:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Dette indikerer, at værdierne bevæger sig i samme retning. Dette er logisk, da et større butiksareal svarer til et større antal varer. En væsentlig ulempe ved kovarians er, at værdien kan være uendelig.
Tak for dine kommentarer!