Завдання: Підсумкове Застосування
У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.
Swipe to start coding
Ви працюєте з набором даних про пінгвінів. Ваша мета — побудувати повний конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN). Конвеєр повинен обробляти кодування категоріальних ознак, пропущені значення, масштабування ознак та налаштування параметрів.
- Закодуйте цільову змінну
yза допомогою класуLabelEncoder. - Розділіть набір даних на тренувальну та тестову вибірки за допомогою
train_test_split()з параметромtest_size=0.33. - Створіть
ColumnTransformerз ім’ямct, який застосовуєOneHotEncoderдо стовпців'island'та'sex', залишаючи всі інші стовпці без змін (remainder='passthrough'). - Визначте сітку параметрів
param_grid, яка містить такі значення дляn_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25], а також'weights'('uniform','distance') і'p'(1,2). - Створіть об’єкт
GridSearchCV, використовуючиKNeighborsClassifier()як оцінювач іparam_gridяк сітку параметрів. - Побудуйте конвеєр, який включає такі кроки у вказаному порядку:
ColumnTransformer(ct);SimpleImputerзі стратегією'most_frequent';StandardScalerдля масштабування ознак;- Об’єкт
GridSearchCVяк фінальний крок.
- Навчіть конвеєр на тренувальних даних (
X_train,y_train) за допомогою методу.fit(). - Оцініть якість моделі, вивівши тестову оцінку за допомогою
.score(X_test, y_test). - Згенеруйте передбачення на тестових даних і виведіть перші 5 декодованих назв класів за допомогою
label_enc.inverse_transform(). - Виведіть найкращий оцінювач, знайдений
GridSearchCV, використовуючи атрибут.best_estimator_.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.13
Завдання: Підсумкове Застосування
Свайпніть щоб показати меню
У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.
Swipe to start coding
Ви працюєте з набором даних про пінгвінів. Ваша мета — побудувати повний конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN). Конвеєр повинен обробляти кодування категоріальних ознак, пропущені значення, масштабування ознак та налаштування параметрів.
- Закодуйте цільову змінну
yза допомогою класуLabelEncoder. - Розділіть набір даних на тренувальну та тестову вибірки за допомогою
train_test_split()з параметромtest_size=0.33. - Створіть
ColumnTransformerз ім’ямct, який застосовуєOneHotEncoderдо стовпців'island'та'sex', залишаючи всі інші стовпці без змін (remainder='passthrough'). - Визначте сітку параметрів
param_grid, яка містить такі значення дляn_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25], а також'weights'('uniform','distance') і'p'(1,2). - Створіть об’єкт
GridSearchCV, використовуючиKNeighborsClassifier()як оцінювач іparam_gridяк сітку параметрів. - Побудуйте конвеєр, який включає такі кроки у вказаному порядку:
ColumnTransformer(ct);SimpleImputerзі стратегією'most_frequent';StandardScalerдля масштабування ознак;- Об’єкт
GridSearchCVяк фінальний крок.
- Навчіть конвеєр на тренувальних даних (
X_train,y_train) за допомогою методу.fit(). - Оцініть якість моделі, вивівши тестову оцінку за допомогою
.score(X_test, y_test). - Згенеруйте передбачення на тестових даних і виведіть перші 5 декодованих назв класів за допомогою
label_enc.inverse_transform(). - Виведіть найкращий оцінювач, знайдений
GridSearchCV, використовуючи атрибут.best_estimator_.
Рішення
Дякуємо за ваш відгук!
single