Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Підсумкове Застосування | Моделювання
Вступ до ML з Scikit-learn

bookЗавдання: Підсумкове Застосування

У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.

Завдання

Swipe to start coding

Вам надано датасет із пінгвінами. Ваша мета — побудувати конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN), коректно обробляючи кодування, пропущені значення та оптимізацію параметрів.

  1. Закодувати цільову змінну за допомогою LabelEncoder.
  2. Розділити датасет на тренувальну та тестову вибірки з test_size=0.33.
  3. Створити ColumnTransformer (ct), який кодує лише стовпці 'island' та 'sex' за допомогою відповідного енкодера для номінативних даних (OneHotEncoder) і залишає інші стовпці без змін.
  4. Визначити решітку параметрів (param_grid), що містить такі значення для n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Створити об'єкт GridSearchCV з KNeighborsClassifier як базовим оцінювачем і param_grid як параметрами.
  6. Побудувати конвеєр, що складається з:
  • ColumnTransformer (ct);
  • SimpleImputer (strategy = 'most_frequent');
  • StandardScaler;
  • і GridSearchCV як фінального кроку.
  1. Навчити конвеєр на тренувальних даних (X_train, y_train).
  2. Оцінити модель на тестових даних, вивівши її .score(X_test, y_test).
  3. Передбачити на тестовій вибірці та вивести перші 5 декодованих передбачень за допомогою label_enc.inverse_transform().
  4. Нарешті, вивести найкращий оцінювач, знайдений за допомогою GridSearchCV.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 10
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain the steps involved in the full workflow shown here?

What is the purpose of each tool or method depicted in the images?

Can you provide a summary of how these components work together in a machine learning project?

close

Awesome!

Completion rate improved to 3.13

bookЗавдання: Підсумкове Застосування

Свайпніть щоб показати меню

У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.

Завдання

Swipe to start coding

Вам надано датасет із пінгвінами. Ваша мета — побудувати конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN), коректно обробляючи кодування, пропущені значення та оптимізацію параметрів.

  1. Закодувати цільову змінну за допомогою LabelEncoder.
  2. Розділити датасет на тренувальну та тестову вибірки з test_size=0.33.
  3. Створити ColumnTransformer (ct), який кодує лише стовпці 'island' та 'sex' за допомогою відповідного енкодера для номінативних даних (OneHotEncoder) і залишає інші стовпці без змін.
  4. Визначити решітку параметрів (param_grid), що містить такі значення для n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Створити об'єкт GridSearchCV з KNeighborsClassifier як базовим оцінювачем і param_grid як параметрами.
  6. Побудувати конвеєр, що складається з:
  • ColumnTransformer (ct);
  • SimpleImputer (strategy = 'most_frequent');
  • StandardScaler;
  • і GridSearchCV як фінального кроку.
  1. Навчити конвеєр на тренувальних даних (X_train, y_train).
  2. Оцінити модель на тестових даних, вивівши її .score(X_test, y_test).
  3. Передбачити на тестовій вибірці та вивести перші 5 декодованих передбачень за допомогою label_enc.inverse_transform().
  4. Нарешті, вивести найкращий оцінювач, знайдений за допомогою GridSearchCV.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 10
single

single

some-alt