Зміст курсу
Вивчення Статистики з Python
Вивчення Статистики з Python
4. Коваріація проти Кореляції
Обчислення Дисперсії за Допомогою Python
Обчислення дисперсії за допомогою NumPy
У numpy
передайте послідовність значень (наприклад, стовпець із набору даних) у функцію np.var()
, наприклад: np.var(df['work_year'])
.
Обчислення дисперсії за допомогою pandas
У pandas
застосуйте метод .var()
безпосередньо до стовпця, ось так: df['work_year'].var()
.
Обидва методи дають схожі результати, з незначними відмінностями через використання різних знаменників: N у numpy
(дисперсія генеральної сукупності) та N-1 у pandas
(дисперсія вибірки).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Все було зрозуміло?
Дякуємо за ваш відгук!
Секція 3. Розділ 3