Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Конвеєр Попередньої Обробки | Інженерія Ознак для Машинного Навчання
Попередня Обробка Даних та Створення Ознак

bookЗавдання: Конвеєр Попередньої Обробки

Завдання

Swipe to start coding

Вам надано датасет Titanic з бібліотеки seaborn. Ваше завдання — побудувати повний конвеєр попередньої обробки даних, який виконує всі основні трансформації даних, необхідні перед машинним навчанням.

Виконайте наступні кроки:

  1. Завантажте датасет за допомогою sns.load_dataset("titanic").
  2. Обробіть пропущені значення:
  • Числові стовпці → заповнити середнім значенням.
  • Категоріальні стовпці → заповнити модою.
  1. Закодуйте категоріальні ознаки sex та embarked за допомогою pd.get_dummies().
  2. Масштабуйте числові стовпці age та fare за допомогою StandardScaler.
  3. Створіть нову ознаку family_size = sibsp + parch + 1.
  4. Об'єднайте всі трансформації у функцію з назвою preprocess_titanic(data), яка повертає фінальний оброблений DataFrame.
  5. Присвойте оброблений датасет змінній з назвою processed_data.

Виведіть перші 5 рядків фінального DataFrame.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain that in simpler terms?

What are the main benefits of this approach?

Are there any common mistakes to avoid with this?

close

Awesome!

Completion rate improved to 8.33

bookЗавдання: Конвеєр Попередньої Обробки

Свайпніть щоб показати меню

Завдання

Swipe to start coding

Вам надано датасет Titanic з бібліотеки seaborn. Ваше завдання — побудувати повний конвеєр попередньої обробки даних, який виконує всі основні трансформації даних, необхідні перед машинним навчанням.

Виконайте наступні кроки:

  1. Завантажте датасет за допомогою sns.load_dataset("titanic").
  2. Обробіть пропущені значення:
  • Числові стовпці → заповнити середнім значенням.
  • Категоріальні стовпці → заповнити модою.
  1. Закодуйте категоріальні ознаки sex та embarked за допомогою pd.get_dummies().
  2. Масштабуйте числові стовпці age та fare за допомогою StandardScaler.
  3. Створіть нову ознаку family_size = sibsp + parch + 1.
  4. Об'єднайте всі трансформації у функцію з назвою preprocess_titanic(data), яка повертає фінальний оброблений DataFrame.
  5. Присвойте оброблений датасет змінній з назвою processed_data.

Виведіть перші 5 рядків фінального DataFrame.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 4
single

single

some-alt