Summary  
This chapter shows how to compute covariance between two numeric sequences in Python using NumPy’s np.cov() function, extract the covariance value, and printing the rounded result to assess the direction of their linear relationship.

General domain of usage  
Data analysis

**Коваріація** — міра спільної мінливості двох випадкових змінних.

Визначення

Формули для **вибіркової** та **генеральної** коваріації відрізняються, але тут вони детально не розглядаються. У цьому розділі розглядається обчислення коваріації для наступного набору даних:


- `Store_ID`: the unique id of the store;
- `Store_Area`: the area of the store;
- `Items_Available`: the number of items that are available in the store;
- `Daily_Customer_Count`: the daily number of customers in the store;
- `Store_Sales`: the number of sales in the store.

## Обчислення коваріації за допомогою Python

Для обчислення коваріації в Python використовуйте функцію `np.cov()` з бібліотеки **NumPy**. Вона приймає два параметри: послідовності даних, для яких потрібно обчислити коваріацію.

Результат знаходиться за індексом `[0,1]`. У цьому курсі інші значення у виведеному результаті не розглядаються, зверніться до прикладу:

import pandas as pd 
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv')

# Calculating covariance 
cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1]

print(round(cov, 2))

Це свідчить про те, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.

Побудова міцної основи в статистиці за допомогою Python. Вивчення основних статистичних концепцій і їх застосування через NumPy та pandas. Перехід від базових мір, таких як середнє та дисперсія, до перевірки гіпотез, довірчих інтервалів і отримання висновків на основі даних із практичними завданнями.

Ознайомтеся з основними статистичними принципами, включаючи типи даних, міри центральної тенденції та ключові відмінності між вибірками і генеральними сукупностями.

Навчіться обчислювати та інтерпретувати середнє, медіану та моду за допомогою Python. Практикуйте ці операції з використанням pandas для аналізу реальних наборів даних.

Зрозумійте, як дисперсія та стандартне відхилення вимірюють розподіл даних. Дізнайтеся, як обчислювати ці показники вручну та за допомогою інструментів Python.

Дослідження того, як коваріація та кореляція описують взаємозв'язки між змінними. Практичні вправи з обчислення та порівняння обох показників у Python.

Оволодіння інтервальними оцінками для оцінки параметрів генеральної сукупності. Використання NumPy, pandas та бібліотек для візуалізації для обчислення та інтерпретації інтервалів на основі реальних даних.

Вивчення основ перевірки гіпотез і t-тесту. Розуміння принципів розробки, проведення та інтерпретації тестів за допомогою Python для підтримки прийняття рішень на основі даних.