Summary  
This chapter shows how to compute covariance between two numeric sequences in Python using NumPy’s np.cov() function, extract the covariance value, and printing the rounded result to assess the direction of their linear relationship.

General domain of usage  
Data analysis

**Covariantie** is een maat voor de gezamenlijke variabiliteit van twee willekeurige variabelen.

Definitie

De formules voor **steekproef**- en **populatie**covariantie verschillen, maar worden hier niet in detail besproken. Dit hoofdstuk richt zich op het berekenen van de covariantie voor de volgende dataset:


- `Store_ID`: the unique id of the store;
- `Store_Area`: the area of the store;
- `Items_Available`: the number of items that are available in the store;
- `Daily_Customer_Count`: the daily number of customers in the store;
- `Store_Sales`: the number of sales in the store.

## Covariantie berekenen met Python

Voor het berekenen van covariantie in Python gebruik je de functie `np.cov()` uit de **NumPy**-bibliotheek. Deze functie neemt twee parameters: de gegevensreeksen waarvoor je de covariantie wilt berekenen.

Het resultaat is de waarde op index `[0,1]`. Deze cursus behandelt de andere waarden in de uitvoer niet, zie het voorbeeld:

import pandas as pd 
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv')

# Calculating covariance 
cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1]

print(round(cov, 2))

Dit geeft aan dat de waarden in dezelfde richting bewegen. Dit is logisch, omdat een groter winkeloppervlak overeenkomt met een groter aantal artikelen. Een belangrijk nadeel van covariantie is dat de waarde oneindig kan zijn.

Bouw een sterke basis in statistiek met behulp van Python. Leer essentiële statistische concepten en pas deze toe via NumPy en pandas. Ga van basismaatregelen zoals gemiddelde en variantie naar hypothese-toetsing, betrouwbaarheidsintervallen en data-gedreven inzichten met praktische oefeningen.

Ontdek de kernprincipes van statistiek, waaronder datatypes, maten van centrale tendentie en belangrijke verschillen tussen steekproeven en populaties.

Leer het berekenen en interpreteren van het gemiddelde, de mediaan en de modus met Python. Oefen deze bewerkingen met pandas om echte datasets te analyseren.

Begrijpen hoe variantie en standaarddeviatie de spreiding van gegevens meten. Leren om beide handmatig en met behulp van Python-tools te berekenen.

Ontdek hoe covariantie en correlatie relaties tussen variabelen beschrijven. Oefen met het berekenen en vergelijken van beide statistieken in Python.

Beheers betrouwbaarheidsintervallen om populatieparameters te schatten. Gebruik NumPy, pandas en visualisatielibraries om intervallen te berekenen en te interpreteren met echte data.

Leer de basisprincipes van hypothesetoetsing en de t-toets. Begrijp hoe je testen ontwerpt, uitvoert en interpreteert met Python ter ondersteuning van datagedreven besluitvorming.