Summary  
Demonstrates how to calculate variance using NumPy’s np.var (population variance) and pandas’ .var() (sample variance) methods on a sequence of values.

General domain of usage  
Data analysis

## Обчислення дисперсії за допомогою NumPy

У `numpy` передайте послідовність значень (наприклад, стовпець з набору даних) у функцію `np.var()`, наприклад: `np.var(df['work_year'])`.

## Обчислення дисперсії за допомогою pandas

У `pandas` застосуйте метод `.var()` безпосередньо до стовпця, ось так: `df['work_year'].var()`.

Обидва методи дають схожі результати, з невеликими відмінностями через використання різних знаменників: **N** у `numpy` (дисперсія генеральної сукупності) та **N-1** у `pandas` (дисперсія вибірки).

import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0)

# Calculate the variance using the function from the NumPy library
var_1 = np.var(df['salary_in_usd'])
# Calculate the variance using the function from the pandas library
var_2 = df['salary_in_usd'].var()

print('The variace using NumPy library is', var_1)
print('The variace using pandas library is', var_2)

Побудова міцної основи в статистиці за допомогою Python. Вивчення основних статистичних концепцій і їх застосування через NumPy та pandas. Перехід від базових мір, таких як середнє та дисперсія, до перевірки гіпотез, довірчих інтервалів і отримання висновків на основі даних із практичними завданнями.

Ознайомтеся з основними статистичними принципами, включаючи типи даних, міри центральної тенденції та ключові відмінності між вибірками і генеральними сукупностями.

Навчіться обчислювати та інтерпретувати середнє, медіану та моду за допомогою Python. Практикуйте ці операції з використанням pandas для аналізу реальних наборів даних.

Зрозумійте, як дисперсія та стандартне відхилення вимірюють розподіл даних. Дізнайтеся, як обчислювати ці показники вручну та за допомогою інструментів Python.

Дослідження того, як коваріація та кореляція описують взаємозв'язки між змінними. Практичні вправи з обчислення та порівняння обох показників у Python.

Оволодіння інтервальними оцінками для оцінки параметрів генеральної сукупності. Використання NumPy, pandas та бібліотек для візуалізації для обчислення та інтерпретації інтервалів на основі реальних даних.

Вивчення основ перевірки гіпотез і t-тесту. Розуміння принципів розробки, проведення та інтерпретації тестів за допомогою Python для підтримки прийняття рішень на основі даних.

Обчислення Дисперсії за Допомогою Python

Обчислення дисперсії за допомогою NumPy

Обчислення дисперсії за допомогою pandas