Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Кодування Категоріальних Змінних | Попередня Обробка Даних Із Scikit-learn
Вступ до ML з Scikit-learn

bookЗавдання: Кодування Категоріальних Змінних

Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який кодувальник слід використовувати:

У цьому завданні надається набір даних про пінгвінів (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' стовпець), необхідно закодувати.

Нагадування про структуру набору даних:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Зверніть увагу, що 'island' та 'sex' є категоріальними ознаками, а 'species' — категоріальною цільовою змінною.

Завдання

Swipe to start coding

Закодуйте всі категоріальні ознаки. Використайте one-hot encoding для стовпців 'island' та 'sex', а для стовпця 'species' застосуйте label encoder (або подібний target encoder). Виконайте ці кроки для завершення кодування.

  1. Імпортуйте OnehotEncoder та LabelEncoder.
  2. Ініціалізуйте об'єкт енкодера для ознак.
  3. Закодуйте категоріальні стовпці ознак за допомогою об'єкта feature_enc.
  4. Ініціалізуйте об'єкт енкодера для цільової змінної.
  5. Закодуйте цільову змінну за допомогою об'єкта label_enc.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 8
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookЗавдання: Кодування Категоріальних Змінних

Свайпніть щоб показати меню

Щоб підсумувати попередні три розділи, ось таблиця, яка показує, який кодувальник слід використовувати:

У цьому завданні надається набір даних про пінгвінів (без пропущених значень). Усі категоріальні ознаки, включаючи цільову ('species' стовпець), необхідно закодувати.

Нагадування про структуру набору даних:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Зверніть увагу, що 'island' та 'sex' є категоріальними ознаками, а 'species' — категоріальною цільовою змінною.

Завдання

Swipe to start coding

Закодуйте всі категоріальні ознаки. Використайте one-hot encoding для стовпців 'island' та 'sex', а для стовпця 'species' застосуйте label encoder (або подібний target encoder). Виконайте ці кроки для завершення кодування.

  1. Імпортуйте OnehotEncoder та LabelEncoder.
  2. Ініціалізуйте об'єкт енкодера для ознак.
  3. Закодуйте категоріальні стовпці ознак за допомогою об'єкта feature_enc.
  4. Ініціалізуйте об'єкт енкодера для цільової змінної.
  5. Закодуйте цільову змінну за допомогою об'єкта label_enc.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

close

Awesome!

Completion rate improved to 3.13
Секція 2. Розділ 8
single

single

some-alt