Завдання: Кодування Категоріальних Змінних
Щоб підсумувати попередні три розділи, наведено таблицю, яка показує, який кодувальник слід використовувати:
У цьому завданні ви працюєте з набором даних penguins (без пропущених значень). Усі категоріальні ознаки — включаючи цільову 'species' — необхідно закодувати для використання в ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Майте на увазі, що 'island' та 'sex' є категоріальними ознаками, а 'species' — категоріальною цільовою змінною.
Swipe to start coding
Вам надано DataFrame df. Закодуйте всі категоріальні стовпці:
- Імпортуйте
OneHotEncoderтаLabelEncoderзsklearn.preprocessing. - Розділіть дані на
X(ознаки) таy(ціль). - Створіть
OneHotEncoderі застосуйте його до стовпців'island'та'sex'уX. - Замініть ці оригінальні стовпці на їх закодовані версії.
- Використайте
LabelEncoderдля стовпця'species'для кодуванняy.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
What are the steps to encode the categorical features and target in this dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
How do I choose which encoder to use for each column in the penguins dataset?
Чудово!
Completion показник покращився до 3.13
Завдання: Кодування Категоріальних Змінних
Свайпніть щоб показати меню
Щоб підсумувати попередні три розділи, наведено таблицю, яка показує, який кодувальник слід використовувати:
У цьому завданні ви працюєте з набором даних penguins (без пропущених значень). Усі категоріальні ознаки — включаючи цільову 'species' — необхідно закодувати для використання в ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Майте на увазі, що 'island' та 'sex' є категоріальними ознаками, а 'species' — категоріальною цільовою змінною.
Swipe to start coding
Вам надано DataFrame df. Закодуйте всі категоріальні стовпці:
- Імпортуйте
OneHotEncoderтаLabelEncoderзsklearn.preprocessing. - Розділіть дані на
X(ознаки) таy(ціль). - Створіть
OneHotEncoderі застосуйте його до стовпців'island'та'sex'уX. - Замініть ці оригінальні стовпці на їх закодовані версії.
- Використайте
LabelEncoderдля стовпця'species'для кодуванняy.
Рішення
Дякуємо за ваш відгук!
single