Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Що Ми Робитимемо зі Значеннями NaN? | Попередня Обробка Даних
Просунуті Техніки в Pandas

bookЩо Ми Робитимемо зі Значеннями NaN?

У попередньому розділі ви отримали результат:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin, де маємо 327 пропущених значень. Заповнювати їх недоцільно, оскільки інформації тут мінімум. Тому в даному випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Однією з причин є те, що можна видалити лише ті рядки, які містять пропущені значення, але ми не можемо видалити 327 рядків із 418. Тож розглянемо, як це зробити.

Щоб видалити стовпець, потрібно застосувати метод .drop() до набору даних. Синтаксис наступний:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Пояснення:

  • .drop() — метод, який видаляє стовпці;
  • columns = 'column_name' або columns = ['column_1', 'column_2'] — аргумент функції, де вказуються назва або назви стовпців, які потрібно видалити;
  • inplace = True — корисний аргумент pandas, що дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Завдання

Swipe to start coding

Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:

  1. Видаліть стовпець 'Cabin', використовуючи аргумент inplace = True.
  2. Виведіть випадкові 5 рядків з набору даних.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 3
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain what happens if I don't use `inplace=True`?

What should I do if I want to delete multiple columns at once?

Is there a way to undo the column deletion if I make a mistake?

close

Awesome!

Completion rate improved to 3.03

bookЩо Ми Робитимемо зі Значеннями NaN?

Свайпніть щоб показати меню

У попередньому розділі ви отримали результат:

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin, де маємо 327 пропущених значень. Заповнювати їх недоцільно, оскільки інформації тут мінімум. Тому в даному випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Однією з причин є те, що можна видалити лише ті рядки, які містять пропущені значення, але ми не можемо видалити 327 рядків із 418. Тож розглянемо, як це зробити.

Щоб видалити стовпець, потрібно застосувати метод .drop() до набору даних. Синтаксис наступний:

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Пояснення:

  • .drop() — метод, який видаляє стовпці;
  • columns = 'column_name' або columns = ['column_1', 'column_2'] — аргумент функції, де вказуються назва або назви стовпців, які потрібно видалити;
  • inplace = True — корисний аргумент pandas, що дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Завдання

Swipe to start coding

Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:

  1. Видаліть стовпець 'Cabin', використовуючи аргумент inplace = True.
  2. Виведіть випадкові 5 рядків з набору даних.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 3
single

single

some-alt