Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Кодування Категоріальних Змінних | Попередня Обробка Даних Із Scikit-learn
Вступ до машинного навчання з Python

bookЗавдання: Кодування Категоріальних Змінних

Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який енкодер слід використовувати:

У цьому завданні надається набір даних penguins (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' column), необхідно закодувати.

Нагадування про структуру набору даних:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Майте на увазі, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.

Завдання

Swipe to start coding

Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваше завдання — закодувати всі категоріальні ознаки, щоб дані можна було використовувати в моделі машинного навчання.

  1. Імпортуйте класи OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Відокремте матрицю ознак X та цільову змінну y з DataFrame.
  3. Створіть об'єкт OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть оригінальні категоріальні стовпці на закодовані.
  5. Створіть об'єкт LabelEncoder і застосуйте його до стовпця 'species', щоб закодувати цільову змінну y.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.13

bookЗавдання: Кодування Категоріальних Змінних

Свайпніть щоб показати меню

Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який енкодер слід використовувати:

У цьому завданні надається набір даних penguins (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' column), необхідно закодувати.

Нагадування про структуру набору даних:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Майте на увазі, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.

Завдання

Swipe to start coding

Вам надано DataFrame під назвою df, який містить дані про пінгвінів.
Ваше завдання — закодувати всі категоріальні ознаки, щоб дані можна було використовувати в моделі машинного навчання.

  1. Імпортуйте класи OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Відокремте матрицю ознак X та цільову змінну y з DataFrame.
  3. Створіть об'єкт OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть оригінальні категоріальні стовпці на закодовані.
  5. Створіть об'єкт LabelEncoder і застосуйте його до стовпця 'species', щоб закодувати цільову змінну y.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

some-alt