Секція 3. Розділ 4
single
Завдання: Конвеєр Попередньої Обробки
Свайпніть щоб показати меню
Завдання
Swipe to start coding
Вам надано датасет Titanic з бібліотеки seaborn.
Ваше завдання — побудувати повний конвеєр попередньої обробки даних, який виконує всі основні трансформації даних, необхідні перед машинним навчанням.
Виконайте наступні кроки:
- Завантажте датасет за допомогою
sns.load_dataset("titanic"). - Обробіть пропущені значення:
- Числові стовпці → заповнити середнім значенням.
- Категоріальні стовпці → заповнити модою.
- Закодуйте категоріальні ознаки
sexтаembarkedза допомогоюpd.get_dummies(). - Масштабуйте числові стовпці
ageтаfareза допомогоюStandardScaler. - Створіть нову ознаку
family_size = sibsp + parch + 1. - Об'єднайте всі трансформації у функцію з назвою
preprocess_titanic(data), яка повертає фінальний оброблений DataFrame. - Присвойте оброблений датасет змінній з назвою
processed_data.
Виведіть перші 5 рядків фінального DataFrame.
Рішення
Все було зрозуміло?
Дякуємо за ваш відгук!
Секція 3. Розділ 4
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат