Що Ми Робитимемо зі Значеннями NaN?
У попередньому розділі ви отримали результат:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin
, де маємо 327
пропущених значень. Заповнювати їх недоцільно, оскільки інформації тут мінімум. Тому в даному випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Однією з причин є те, що можна видалити лише ті рядки, які містять пропущені значення, але ми не можемо видалити 327 рядків із 418. Тож розглянемо, як це зробити.
Щоб видалити стовпець, потрібно застосувати метод .drop()
до набору даних. Синтаксис наступний:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Пояснення:
.drop()
— метод, який видаляє стовпці;columns = 'column_name'
абоcolumns = ['column_1', 'column_2']
— аргумент функції, де вказуються назва або назви стовпців, які потрібно видалити;inplace = True
— корисний аргумент pandas, що дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Swipe to start coding
Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:
- Видаліть стовпець
'Cabin'
, використовуючи аргументinplace = True
. - Виведіть випадкові
5
рядків з набору даних.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain what happens if I don't use `inplace=True`?
What should I do if I want to delete multiple columns at once?
Is there a way to undo the column deletion if I make a mistake?
Awesome!
Completion rate improved to 3.03
Що Ми Робитимемо зі Значеннями NaN?
Свайпніть щоб показати меню
У попередньому розділі ви отримали результат:
PassengerId | 0 |
Survived | 0 |
Pclass | 0 |
Name | 0 |
Sex | 0 |
Age | 86 |
SibSp | 0 |
Parch | 0 |
Ticket | 0 |
Fare | 1 |
Cabin | 327 |
Embarked | 0 |
У наборі даних 418 рядків. Зверніть увагу на стовпець Cabin
, де маємо 327
пропущених значень. Заповнювати їх недоцільно, оскільки інформації тут мінімум. Тому в даному випадку найкраще рішення — видалити стовпець, який для нас не має сенсу. Однією з причин є те, що можна видалити лише ті рядки, які містять пропущені значення, але ми не можемо видалити 327 рядків із 418. Тож розглянемо, як це зробити.
Щоб видалити стовпець, потрібно застосувати метод .drop()
до набору даних. Синтаксис наступний:
# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)
# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)
Пояснення:
.drop()
— метод, який видаляє стовпці;columns = 'column_name'
абоcolumns = ['column_1', 'column_2']
— аргумент функції, де вказуються назва або назви стовпців, які потрібно видалити;inplace = True
— корисний аргумент pandas, що дозволяє зберігати всі зміни. Його можна використовувати й в інших функціях; деякі з них ми розглянемо пізніше.
Swipe to start coding
Ваше завдання — видалити стовпець з найбільшою кількістю значень NaN. Дотримуйтесь такого алгоритму:
- Видаліть стовпець
'Cabin'
, використовуючи аргументinplace = True
. - Виведіть випадкові
5
рядків з набору даних.
Рішення
Дякуємо за ваш відгук!
single