Опис Даних
pandas
пропонує зручний метод mean()
, який обчислює середнє значення всіх значень для кожного стовпця.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Ви також можете використовувати той самий метод для визначення середнього значення для конкретного стовпця:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas
також надає метод mode()
, який визначає найчастіше зустрічаючеся значення в кожному стовпці.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Щоб знайти моду для конкретного стовпця, використовується той самий метод:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Інший корисний метод у pandas
- це describe()
.
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Цей метод надає огляд різних метрик з набору даних, включаючи:
- Загальна кількість записів;
- Середнє або середнє значення;
- Стандартне відхилення;
- Мінімальні та максимальні значення;
- 25-й, 50-й (медіана) та 75-й перцентилі.
Завдання
Swipe to start coding
- Обчисліть середнє значення стовпця
'residual sugar'
. - Обчисліть моду стовпця
'fixed acidity'
. - Отримайте огляд різних статистик з
wine_data
та збережіть результат уdescribed_data
.
Рішення
Все було зрозуміло?
Дякуємо за ваш відгук!