Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Підсумкове Застосування | Моделювання
Вступ до ML з Scikit-learn

bookЗавдання: Підсумкове Застосування

У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.

Завдання

Swipe to start coding

Ви працюєте з набором даних про пінгвінів. Ваша мета — побудувати повний конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN). Конвеєр повинен обробляти кодування категоріальних ознак, пропущені значення, масштабування ознак та налаштування параметрів.

  1. Закодуйте цільову змінну y за допомогою класу LabelEncoder.
  2. Розділіть набір даних на тренувальну та тестову вибірки за допомогою train_test_split() з параметром test_size=0.33.
  3. Створіть ColumnTransformer з ім’ям ct, який застосовує OneHotEncoder до стовпців 'island' та 'sex', залишаючи всі інші стовпці без змін (remainder='passthrough').
  4. Визначте сітку параметрів param_grid, яка містить такі значення для n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], а також 'weights' ('uniform', 'distance') і 'p' (1, 2).
  5. Створіть об’єкт GridSearchCV, використовуючи KNeighborsClassifier() як оцінювач і param_grid як сітку параметрів.
  6. Побудуйте конвеєр, який включає такі кроки у вказаному порядку:
  • ColumnTransformer (ct);
  • SimpleImputer зі стратегією 'most_frequent';
  • StandardScaler для масштабування ознак;
  • Об’єкт GridSearchCV як фінальний крок.
  1. Навчіть конвеєр на тренувальних даних (X_train, y_train) за допомогою методу .fit().
  2. Оцініть якість моделі, вивівши тестову оцінку за допомогою .score(X_test, y_test).
  3. Згенеруйте передбачення на тестових даних і виведіть перші 5 декодованих назв класів за допомогою label_enc.inverse_transform().
  4. Виведіть найкращий оцінювач, знайдений GridSearchCV, використовуючи атрибут .best_estimator_.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 10
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.13

bookЗавдання: Підсумкове Застосування

Свайпніть щоб показати меню

У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.

Завдання

Swipe to start coding

Ви працюєте з набором даних про пінгвінів. Ваша мета — побудувати повний конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN). Конвеєр повинен обробляти кодування категоріальних ознак, пропущені значення, масштабування ознак та налаштування параметрів.

  1. Закодуйте цільову змінну y за допомогою класу LabelEncoder.
  2. Розділіть набір даних на тренувальну та тестову вибірки за допомогою train_test_split() з параметром test_size=0.33.
  3. Створіть ColumnTransformer з ім’ям ct, який застосовує OneHotEncoder до стовпців 'island' та 'sex', залишаючи всі інші стовпці без змін (remainder='passthrough').
  4. Визначте сітку параметрів param_grid, яка містить такі значення для n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], а також 'weights' ('uniform', 'distance') і 'p' (1, 2).
  5. Створіть об’єкт GridSearchCV, використовуючи KNeighborsClassifier() як оцінювач і param_grid як сітку параметрів.
  6. Побудуйте конвеєр, який включає такі кроки у вказаному порядку:
  • ColumnTransformer (ct);
  • SimpleImputer зі стратегією 'most_frequent';
  • StandardScaler для масштабування ознак;
  • Об’єкт GridSearchCV як фінальний крок.
  1. Навчіть конвеєр на тренувальних даних (X_train, y_train) за допомогою методу .fit().
  2. Оцініть якість моделі, вивівши тестову оцінку за допомогою .score(X_test, y_test).
  3. Згенеруйте передбачення на тестових даних і виведіть перші 5 декодованих назв класів за допомогою label_enc.inverse_transform().
  4. Виведіть найкращий оцінювач, знайдений GridSearchCV, використовуючи атрибут .best_estimator_.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 10
single

single

some-alt