Завдання: Кодування Категоріальних Змінних
Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який кодувальник слід використовувати:
У цьому завданні надається набір даних про пінгвінів (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species'
стовпець), необхідно закодувати.
Нагадування про структуру набору даних:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Зверніть увагу, що 'island'
та 'sex'
є категоріальними ознаками, а 'species'
— категоріальною цільовою змінною.
Swipe to start coding
Закодуйте всі категоріальні ознаки. Використайте one-hot encoding для стовпців 'island'
та 'sex'
, а для стовпця 'species'
застосуйте label encoder (або подібний target encoder). Виконайте ці кроки для завершення кодування.
- Імпортуйте
OnehotEncoder
таLabelEncoder
. - Ініціалізуйте об'єкт енкодера для ознак.
- Закодуйте категоріальні стовпці ознак за допомогою об'єкта
feature_enc
. - Ініціалізуйте об'єкт енкодера для цільової змінної.
- Закодуйте цільову змінну за допомогою об'єкта
label_enc
.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Завдання: Кодування Категоріальних Змінних
Свайпніть щоб показати меню
Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який кодувальник слід використовувати:
У цьому завданні надається набір даних про пінгвінів (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species'
стовпець), необхідно закодувати.
Нагадування про структуру набору даних:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Зверніть увагу, що 'island'
та 'sex'
є категоріальними ознаками, а 'species'
— категоріальною цільовою змінною.
Swipe to start coding
Закодуйте всі категоріальні ознаки. Використайте one-hot encoding для стовпців 'island'
та 'sex'
, а для стовпця 'species'
застосуйте label encoder (або подібний target encoder). Виконайте ці кроки для завершення кодування.
- Імпортуйте
OnehotEncoder
таLabelEncoder
. - Ініціалізуйте об'єкт енкодера для ознак.
- Закодуйте категоріальні стовпці ознак за допомогою об'єкта
feature_enc
. - Ініціалізуйте об'єкт енкодера для цільової змінної.
- Закодуйте цільову змінну за допомогою об'єкта
label_enc
.
Рішення
Дякуємо за ваш відгук!
Awesome!
Completion rate improved to 3.13single