Sum() та Count()
pandas
пропонує метод count()
, який рахує всі ненульові клітинки (ні None
, ні NaN
) для кожного стовпця.
df = pd.read_csv(file.csv)
number_of_cells = df.count()
Щоб знайти кількість ненульових значень у конкретному стовпці, використовуйте наступний синтаксис:
df = pd.read_csv(file.csv)
number_of_cells = df['name of the column'].count()
pandas
також надає метод sum()
. Цей метод обчислює суму значень для кожного стовпця, але він працює лише з числовими або булевими стовпцями.
df = pd.read_csv(file.csv)
total = df.sum()
Оскільки метод isna()
повертає булевий DataFrame, ви можете використовувати наступний синтаксис для обчислення кількості відсутніх значень для кожного зі стовпців:
missing_values_count = df.isna().sum()
Щоб знайти суму значень у певному стовпці, використовуйте наступний синтаксис:
df = pd.read_csv(file.csv)
total = df['name of the column'].sum()
Завдання
Swipe to start coding
Дано DataFrame audi_cars
:
- Визначте кількість ненульових клітинок у кожному стовпці.
- Обчисліть загальну ціну (використовуючи стовпець
price
) для всіх автомобілів у DataFrame. - Визначте кількість відсутніх значень у кожному стовпці.
Рішення
Все було зрозуміло?
Дякуємо за ваш відгук!