Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Заповнення Пропущених Значень | Попередня Обробка Даних
Просунуті Техніки в Pandas

bookЗаповнення Пропущених Значень

Видалення пропущених значень — не єдиний спосіб їх усунення. Ви також можете замінити всі NaN на визначене значення, наприклад, на середнє значення стовпця або на нулі. Це може бути корисно у багатьох випадках. Ви дізнаєтеся про це у курсі Вивчення статистики з Python.

Розгляньте приклад заповнення пропущених значень у стовпці 'Age' медіанним значенням цього стовпця:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Пояснення:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() — за допомогою аргументу value ми вказуємо методу .fillna(), що робити з NaN значеннями. У цьому випадку ми застосували метод .fillna() до стовпця 'Age' і замінили всі пропущені значення на медіану цього стовпця;
  • inplace=True — аргумент, який дозволяє зберегти зміни.
Завдання

Swipe to start coding

Відсутні значення можуть спричиняти проблеми під час аналізу даних. Один із найпоширеніших способів їх обробки — заміна відсутніх значень на середнє значення стовпця.

Ваше завдання:

  1. Замініть усі значення NaN у стовпці 'Age' на середнє цього стовпця.
  • Використайте метод .fillna() з аргументами value=data['Age'].mean() та inplace=True.
  1. Обчисліть і виведіть кількість залишкових відсутніх значень у стовпці 'Age'.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 5
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.03

bookЗаповнення Пропущених Значень

Свайпніть щоб показати меню

Видалення пропущених значень — не єдиний спосіб їх усунення. Ви також можете замінити всі NaN на визначене значення, наприклад, на середнє значення стовпця або на нулі. Це може бути корисно у багатьох випадках. Ви дізнаєтеся про це у курсі Вивчення статистики з Python.

Розгляньте приклад заповнення пропущених значень у стовпці 'Age' медіанним значенням цього стовпця:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Пояснення:

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() — за допомогою аргументу value ми вказуємо методу .fillna(), що робити з NaN значеннями. У цьому випадку ми застосували метод .fillna() до стовпця 'Age' і замінили всі пропущені значення на медіану цього стовпця;
  • inplace=True — аргумент, який дозволяє зберегти зміни.
Завдання

Swipe to start coding

Відсутні значення можуть спричиняти проблеми під час аналізу даних. Один із найпоширеніших способів їх обробки — заміна відсутніх значень на середнє значення стовпця.

Ваше завдання:

  1. Замініть усі значення NaN у стовпці 'Age' на середнє цього стовпця.
  • Використайте метод .fillna() з аргументами value=data['Age'].mean() та inplace=True.
  1. Обчисліть і виведіть кількість залишкових відсутніх значень у стовпці 'Age'.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 5
single

single

some-alt