Заповнення Пропущених Значень
Видалення пропущених значень — не єдиний спосіб їх усунення. Ви також можете замінити всі NaN на визначене значення, наприклад, на середнє значення стовпця або на нулі. Це може бути корисно у багатьох випадках. Ви дізнаєтеся про це у курсі Вивчення статистики з Python.
Розгляньте приклад заповнення пропущених значень у стовпці 'Age'
медіанним значенням цього стовпця:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Пояснення:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
— за допомогою аргументуvalue
ми вказуємо методу.fillna()
, що робити зNaN
значеннями. У цьому випадку ми застосували метод.fillna()
до стовпця'Age'
і замінили всі пропущені значення на медіану цього стовпця;inplace=True
— аргумент, який дозволяє зберегти зміни.
Swipe to start coding
Відсутні значення можуть спричиняти проблеми під час аналізу даних. Один із найпоширеніших способів їх обробки — заміна відсутніх значень на середнє значення стовпця.
Ваше завдання:
- Замініть усі значення
NaN
у стовпці'Age'
на середнє цього стовпця.
- Використайте метод
.fillna()
з аргументамиvalue=data['Age'].mean()
таinplace=True
.
- Обчисліть і виведіть кількість залишкових відсутніх значень у стовпці
'Age'
.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.03
Заповнення Пропущених Значень
Свайпніть щоб показати меню
Видалення пропущених значень — не єдиний спосіб їх усунення. Ви також можете замінити всі NaN на визначене значення, наприклад, на середнє значення стовпця або на нулі. Це може бути корисно у багатьох випадках. Ви дізнаєтеся про це у курсі Вивчення статистики з Python.
Розгляньте приклад заповнення пропущених значень у стовпці 'Age'
медіанним значенням цього стовпця:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Пояснення:
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
— за допомогою аргументуvalue
ми вказуємо методу.fillna()
, що робити зNaN
значеннями. У цьому випадку ми застосували метод.fillna()
до стовпця'Age'
і замінили всі пропущені значення на медіану цього стовпця;inplace=True
— аргумент, який дозволяє зберегти зміни.
Swipe to start coding
Відсутні значення можуть спричиняти проблеми під час аналізу даних. Один із найпоширеніших способів їх обробки — заміна відсутніх значень на середнє значення стовпця.
Ваше завдання:
- Замініть усі значення
NaN
у стовпці'Age'
на середнє цього стовпця.
- Використайте метод
.fillna()
з аргументамиvalue=data['Age'].mean()
таinplace=True
.
- Обчисліть і виведіть кількість залишкових відсутніх значень у стовпці
'Age'
.
Рішення
Дякуємо за ваш відгук!
single