Секція 2. Розділ 8
single
Challenge: Кодування категоріальних змінних
Свайпніть щоб показати меню
Щоб підсумувати попередні три розділи, наведена таблиця показує, який кодувальник слід використовувати:
У цьому завданні використовується набір даних penguins (без пропущених значень). Усі категоріальні ознаки — включаючи цільову 'species' — необхідно закодувати для використання в машинному навчанні.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Зверніть увагу, що 'island' та 'sex' — це категоріальні ознаки, а 'species' — категоріальна ціль.
Завдання
Проведіть, щоб почати кодувати
Вам надано DataFrame df. Закодуйте всі категоріальні стовпці:
- Імпортуйте
OneHotEncoderтаLabelEncoderзsklearn.preprocessing. - Розділіть дані на
X(ознаки) таy(ціль). - Створіть
OneHotEncoderі застосуйте його до стовпців'island'та'sex'уX. - Замініть ці оригінальні стовпці їх закодованими версіями.
- Використайте
LabelEncoderдля стовпця'species'для кодуванняy.
Рішення
Все було зрозуміло?
Дякуємо за ваш відгук!
Секція 2. Розділ 8
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат