Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Challenge: Кодування категоріальних змінних | Попередня Обробка Даних Із Scikit-learn
Вступ до машинного навчання з Python
Секція 2. Розділ 8
single

single

Challenge: Кодування категоріальних змінних

Свайпніть щоб показати меню

Щоб підсумувати попередні три розділи, наведена таблиця показує, який кодувальник слід використовувати:

Порядкове кодування
One-hot encoding

У цьому завданні використовується набір даних penguins (без пропущених значень). Усі категоріальні ознаки — включаючи цільову 'species' — необхідно закодувати для використання в машинному навчанні.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())

Зверніть увагу, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.

Завдання

Проведіть, щоб почати кодувати

Вам надано DataFrame df. Закодуйте всі категоріальні стовпці:

  1. Імпортуйте OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Розділіть дані на X (ознаки) та y (ціль).
  3. Створіть OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть ці оригінальні стовпці їх закодованими версіями.
  5. Використайте LabelEncoder для стовпця 'species' для кодування y.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

some-alt