Коваріація
Свайпніть щоб показати меню
Коваріація — це міра спільної змінності двох випадкових змінних.
Формули для вибіркової та генеральної коваріації відрізняються, але тут вони не розглядатимуться детально. У цьому розділі розглядається обчислення коваріації для наступного набору даних:
Store_ID: the unique id of the store;Store_Area: the area of the store;Items_Available: the number of items that are available in the store;Daily_Customer_Count: the daily number of customers in the store;Store_Sales: the number of sales in the store.
Обчислення коваріації за допомогою Python
Для обчислення коваріації у Python використовуйте функцію np.cov() з бібліотеки NumPy. Вона приймає два параметри: послідовності даних, для яких потрібно розрахувати коваріацію.
Результат знаходиться за індексом [0,1]. У цьому курсі інші значення вихідних даних не розглядаються, зверніться до прикладу:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
Це свідчить про те, що значення змінюються в одному напрямку. Це логічно, оскільки більша площа магазину відповідає більшій кількості товарів. Одним із суттєвих недоліків коваріації є те, що її значення може бути нескінченним.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат