Summary  
This chapter shows how to compute covariance between two numeric sequences in Python using NumPy’s np.cov() function, extract the covariance value, and printing the rounded result to assess the direction of their linear relationship.

General domain of usage  
Data analysis

**Covarianza** è una misura della variabilità congiunta di due variabili casuali.

Definizione

Le formule per la **covarianza campionaria** e **popolazione** sono diverse, ma non verranno discusse in dettaglio qui. Questo capitolo si concentra sul calcolo della covarianza per il seguente dataset:


- `Store_ID`: the unique id of the store;
- `Store_Area`: the area of the store;
- `Items_Available`: the number of items that are available in the store;
- `Daily_Customer_Count`: the daily number of customers in the store;
- `Store_Sales`: the number of sales in the store.

## Calcolo della covarianza con Python

Per calcolare la covarianza in Python, utilizzare la funzione `np.cov()` della libreria **NumPy**. Accetta due parametri: le sequenze di dati per cui si desidera calcolare la covarianza.

Il risultato si trova all'indice `[0,1]`. Questo corso non tratterà gli altri valori dell'output, fare riferimento all'esempio:

import pandas as pd 
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv')

# Calculating covariance 
cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1]

print(round(cov, 2))

Questo indica che i valori si muovono nella stessa direzione. Questo è logico perché una superficie del negozio più grande corrisponde a un numero maggiore di articoli. Uno svantaggio significativo della covarianza è che il valore può essere infinito.

Costruisci una solida base in statistica utilizzando Python. Impara i concetti statistici essenziali e applicali tramite NumPy e pandas. Passa da misure di base come media e varianza ai test di ipotesi, intervalli di confidenza e approfondimenti basati sui dati con esercitazioni pratiche.

Scopri i principi statistici fondamentali, inclusi i tipi di dati, le misure di tendenza centrale e le principali differenze tra campioni e popolazioni.

Impara a calcolare e interpretare media, mediana e moda utilizzando Python. Esercitati con queste operazioni tramite pandas per analizzare dataset reali.

Comprendere come la varianza e la deviazione standard misurano la dispersione dei dati. Apprendere come calcolare entrambe manualmente e utilizzando strumenti Python.

Esplora come la covarianza e la correlazione descrivono le relazioni tra variabili. Esercitati a calcolare e confrontare entrambe le metriche in Python.

Padroneggiare gli intervalli di confidenza per stimare i parametri della popolazione. Utilizzare NumPy, pandas e librerie di visualizzazione per calcolare e interpretare intervalli con dati reali.

Impara i fondamenti del test delle ipotesi e del t-test. Comprendi come progettare, eseguire e interpretare i test utilizzando Python per supportare decisioni basate sui dati.