Обчислення Дисперсії за Допомогою Python
Обчислення дисперсії за допомогою NumPy
У numpy
передайте послідовність значень (наприклад, стовпець із набору даних) у функцію np.var()
, наприклад: np.var(df['work_year'])
.
Обчислення дисперсії за допомогою pandas
У pandas
застосуйте метод .var()
безпосередньо до стовпця, ось так: df['work_year'].var()
.
Обидва методи дають схожі результати, з незначними відмінностями через використання різних знаменників: N у numpy
(дисперсія генеральної сукупності) та N-1 у pandas
(дисперсія вибірки).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 2.63
Обчислення Дисперсії за Допомогою Python
Свайпніть щоб показати меню
Обчислення дисперсії за допомогою NumPy
У numpy
передайте послідовність значень (наприклад, стовпець із набору даних) у функцію np.var()
, наприклад: np.var(df['work_year'])
.
Обчислення дисперсії за допомогою pandas
У pandas
застосуйте метод .var()
безпосередньо до стовпця, ось так: df['work_year'].var()
.
Обидва методи дають схожі результати, з незначними відмінностями через використання різних знаменників: N у numpy
(дисперсія генеральної сукупності) та N-1 у pandas
(дисперсія вибірки).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Дякуємо за ваш відгук!