Зміст курсу
Вивчення Статистики з Python
Вивчення Статистики з Python
4. Коваріація проти Кореляції
Статистика з Pandas
Бібліотека Pandas вже містить три вбудовані функції для обчислення середнього значення та медіани. Щоб імпортувати pandas
з використанням псевдоніму pd
, скористайтеся наступним синтаксисом:
python
Ось приклад обчислення .mean()
та .median()
для стовпця 'work_year'
у наборі даних з назвою df
.
Можна змінювати стовпці та спостерігати результати:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculating the mean value mean = df['work_year'].mean() # Calculating the median value median = df['work_year'].median() print('The mean value is', mean) print('The median value is', median)
Для обчислення основних статистичних значень використовуйте методи, призначені для роботи з вимірюваннями, такі як:
python
Все було зрозуміло?
Дякуємо за ваш відгук!
Секція 2. Розділ 3