Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Кодування Категоріальних Змінних | Попередня Обробка Даних Із Scikit-learn
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Вступ до машинного навчання з Python

bookЗавдання: Кодування Категоріальних Змінних

Щоб підсумувати попередні три розділи, наведено таблицю, яка показує, який кодувальник слід використовувати:

У цьому завданні ви працюєте з набором даних penguins (без пропущених значень). Усі категоріальні ознаки — включаючи цільову 'species' — необхідно закодувати для використання в ML.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Майте на увазі, що 'island' та 'sex' є категоріальними ознаками, а 'species' — категоріальною цільовою змінною.

Завдання

Swipe to start coding

Вам надано DataFrame df. Закодуйте всі категоріальні стовпці:

  1. Імпортуйте OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Розділіть дані на X (ознаки) та y (ціль).
  3. Створіть OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть ці оригінальні стовпці на їх закодовані версії.
  5. Використайте LabelEncoder для стовпця 'species' для кодування y.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

What are the steps to encode the categorical features and target in this dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

How do I choose which encoder to use for each column in the penguins dataset?

close

bookЗавдання: Кодування Категоріальних Змінних

Свайпніть щоб показати меню

Щоб підсумувати попередні три розділи, наведено таблицю, яка показує, який кодувальник слід використовувати:

У цьому завданні ви працюєте з набором даних penguins (без пропущених значень). Усі категоріальні ознаки — включаючи цільову 'species' — необхідно закодувати для використання в ML.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Майте на увазі, що 'island' та 'sex' є категоріальними ознаками, а 'species' — категоріальною цільовою змінною.

Завдання

Swipe to start coding

Вам надано DataFrame df. Закодуйте всі категоріальні стовпці:

  1. Імпортуйте OneHotEncoder та LabelEncoder з sklearn.preprocessing.
  2. Розділіть дані на X (ознаки) та y (ціль).
  3. Створіть OneHotEncoder і застосуйте його до стовпців 'island' та 'sex' у X.
  4. Замініть ці оригінальні стовпці на їх закодовані версії.
  5. Використайте LabelEncoder для стовпця 'species' для кодування y.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

some-alt