Covarianza
Covarianza è una misura della variabilità congiunta di due variabili casuali.
Le formule per la covarianza campionaria e popolazionale sono diverse, ma non verranno approfondite in dettaglio qui. Questo capitolo si concentra sulle covarianze del seguente dataset:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Calcolo della covarianza con Python
Per calcolare la covarianza in Python, utilizzare la funzione np.cov()
della libreria NumPy. Accetta due parametri: le sequenze di dati per cui si desidera calcolare la covarianza.
Il risultato si trova all'indice [0,1]
. Questo corso non tratterà gli altri valori dell'output, fare riferimento all'esempio:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Questo indica che i valori si muovono nella stessa direzione. Questo è logico perché una superficie del negozio più ampia corrisponde a un numero maggiore di articoli. Un limite significativo della covarianza è che il valore può essere infinito.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Mi faccia domande su questo argomento
Riassuma questo capitolo
Mostri esempi dal mondo reale
Awesome!
Completion rate improved to 2.63
Covarianza
Scorri per mostrare il menu
Covarianza è una misura della variabilità congiunta di due variabili casuali.
Le formule per la covarianza campionaria e popolazionale sono diverse, ma non verranno approfondite in dettaglio qui. Questo capitolo si concentra sulle covarianze del seguente dataset:
Store_ID
: the unique id of the store;Store_Area
: the area of the store;Items_Available
: the number of items that are available in the store;Daily_Customer_Count
: the daily number of customers in the store;Store_Sales
: the number of sales in the store.
Calcolo della covarianza con Python
Per calcolare la covarianza in Python, utilizzare la funzione np.cov()
della libreria NumPy. Accetta due parametri: le sequenze di dati per cui si desidera calcolare la covarianza.
Il risultato si trova all'indice [0,1]
. Questo corso non tratterà gli altri valori dell'output, fare riferimento all'esempio:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Questo indica che i valori si muovono nella stessa direzione. Questo è logico perché una superficie del negozio più ampia corrisponde a un numero maggiore di articoli. Un limite significativo della covarianza è che il valore può essere infinito.
Grazie per i tuoi commenti!