Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Попередня Обробка Набору Даних | Основні Концепції
Кластерний аналіз з Python
Секція 2. Розділ 6
single

single

bookЗавдання: Попередня Обробка Набору Даних

Свайпніть щоб показати меню

Завдання

Swipe to start coding

Вам надано синтетичний набір даних, збережений у змінній data. Ваше завдання — коректно обробити пропущені значення та закодувати категоріальні ознаки.

Виконайте наступні кроки:

  • Замініть пропущені значення у стовпці 'Age' на середнє значення цього стовпця. Перезапишіть оригінальний стовпець отриманим результатом.
  • Створіть екземпляр OneHotEncoder і збережіть його у змінній city_encoder. Обов'язково вкажіть параметр drop='first', щоб уникнути пастки фіктивних змінних.
  • За замовчуванням цей енкодер повертає розріджену матрицю. Щоб забезпечити сумісність із Pandas, встановіть параметр sparse_output=False (або sparse=False для старіших версій) під час ініціалізації, АБО додайте .toarray() під час трансформації даних.
  • Закодуйте значення у стовпці 'City' за допомогою city_encoder.fit_transform() і збережіть отриманий масив у змінній city_encoded.
  • Створіть екземпляр OrdinalEncoder і збережіть його у змінній income_encoder. Оскільки дані мають природну ієрархію, явно визначте порядок за допомогою параметра categories (зверніть увагу, що 'Low' < 'Middle' < 'High').
  • Закодуйте значення у стовпці 'Income' за допомогою income_encoder і перезапишіть оригінальний стовпець 'Income' отриманим результатом.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 6
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

some-alt