Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Kovarianssi | Kovarianssi vs. Korrelaatio
Tilastotieteen Opiskelu Pythonilla
course content

Kurssisisältö

Tilastotieteen Opiskelu Pythonilla

Tilastotieteen Opiskelu Pythonilla

1. Peruskäsitteet
2. Keskiarvo, Mediaani ja Moodi Pythonilla
3. Varianssi ja Keskihajonta
4. Kovarianssi vs. Korrelaatio
5. Luottamusväli
6. Tilastollinen Testaaminen

book
Kovarianssi

Kovarianssi on kahden satunnaismuuttujan yhteisvaihtelun mittari.

Otos- ja perusjoukon kovarianssin kaavat eroavat toisistaan, mutta niitä ei käsitellä tässä tarkemmin. Tässä luvussa keskitytään seuraavan tietoaineiston kovariansseihin:

  • Store_ID: the unique id of the store;

  • Store_Area: the area of the store;

  • Items_Available: the number of items that are available in the store;

  • Daily_Customer_Count: the daily number of customers in the store;

  • Store_Sales: the number of sales in the store.

Kovarianssin laskeminen Pythonilla

Kovarianssin laskemiseen Pythonissa käytetään NumPy-kirjaston np.cov()-funktiota. Se ottaa kaksi parametria: tietojonot, joiden välistä kovarianssia halutaan laskea.

Tulos löytyy indeksistä [0,1]. Tämän kurssin puitteissa muita tuloksen arvoja ei käsitellä, katso esimerkki:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Tämä osoittaa, että arvot muuttuvat samaan suuntaan. Tämä on loogista, koska suurempi myymäläalue tarkoittaa suurempaa tavaramäärää. Yksi merkittävä kovarianssin haittapuoli on, että sen arvo voi olla ääretön.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 1

Kysy tekoälyä

expand
ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

course content

Kurssisisältö

Tilastotieteen Opiskelu Pythonilla

Tilastotieteen Opiskelu Pythonilla

1. Peruskäsitteet
2. Keskiarvo, Mediaani ja Moodi Pythonilla
3. Varianssi ja Keskihajonta
4. Kovarianssi vs. Korrelaatio
5. Luottamusväli
6. Tilastollinen Testaaminen

book
Kovarianssi

Kovarianssi on kahden satunnaismuuttujan yhteisvaihtelun mittari.

Otos- ja perusjoukon kovarianssin kaavat eroavat toisistaan, mutta niitä ei käsitellä tässä tarkemmin. Tässä luvussa keskitytään seuraavan tietoaineiston kovariansseihin:

  • Store_ID: the unique id of the store;

  • Store_Area: the area of the store;

  • Items_Available: the number of items that are available in the store;

  • Daily_Customer_Count: the daily number of customers in the store;

  • Store_Sales: the number of sales in the store.

Kovarianssin laskeminen Pythonilla

Kovarianssin laskemiseen Pythonissa käytetään NumPy-kirjaston np.cov()-funktiota. Se ottaa kaksi parametria: tietojonot, joiden välistä kovarianssia halutaan laskea.

Tulos löytyy indeksistä [0,1]. Tämän kurssin puitteissa muita tuloksen arvoja ei käsitellä, katso esimerkki:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Tämä osoittaa, että arvot muuttuvat samaan suuntaan. Tämä on loogista, koska suurempi myymäläalue tarkoittaa suurempaa tavaramäärää. Yksi merkittävä kovarianssin haittapuoli on, että sen arvo voi olla ääretön.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 1
Pahoittelemme, että jotain meni pieleen. Mitä tapahtui?
some-alt