Завдання: Підсумкове Застосування
У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.
Swipe to start coding
Вам надано датасет із пінгвінами. Ваша мета — побудувати конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN), коректно обробляючи кодування, пропущені значення та оптимізацію параметрів.
- Закодувати цільову змінну за допомогою
LabelEncoder. - Розділити датасет на тренувальну та тестову вибірки з
test_size=0.33. - Створити ColumnTransformer (
ct), який кодує лише стовпці'island'та'sex'за допомогою відповідного енкодера для номінативних даних (OneHotEncoder) і залишає інші стовпці без змін. - Визначити решітку параметрів (
param_grid), що містить такі значення дляn_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25]. - Створити об'єкт
GridSearchCVзKNeighborsClassifierяк базовим оцінювачем іparam_gridяк параметрами. - Побудувати конвеєр, що складається з:
ColumnTransformer(ct);SimpleImputer(strategy ='most_frequent');StandardScaler;- і
GridSearchCVяк фінального кроку.
- Навчити конвеєр на тренувальних даних (
X_train,y_train). - Оцінити модель на тестових даних, вивівши її
.score(X_test, y_test). - Передбачити на тестовій вибірці та вивести перші 5 декодованих передбачень за допомогою
label_enc.inverse_transform(). - Нарешті, вивести найкращий оцінювач, знайдений за допомогою
GridSearchCV.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain the steps involved in the full workflow shown here?
What is the purpose of each tool or method depicted in the images?
Can you provide a summary of how these components work together in a machine learning project?
Awesome!
Completion rate improved to 3.13
Завдання: Підсумкове Застосування
Свайпніть щоб показати меню
У цьому завданні застосуйте повний робочий процес, вивчений у курсі — від попередньої обробки даних до навчання та оцінювання моделі.
Swipe to start coding
Вам надано датасет із пінгвінами. Ваша мета — побудувати конвеєр машинного навчання для класифікації видів пінгвінів за допомогою моделі K-Nearest Neighbors (KNN), коректно обробляючи кодування, пропущені значення та оптимізацію параметрів.
- Закодувати цільову змінну за допомогою
LabelEncoder. - Розділити датасет на тренувальну та тестову вибірки з
test_size=0.33. - Створити ColumnTransformer (
ct), який кодує лише стовпці'island'та'sex'за допомогою відповідного енкодера для номінативних даних (OneHotEncoder) і залишає інші стовпці без змін. - Визначити решітку параметрів (
param_grid), що містить такі значення дляn_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25]. - Створити об'єкт
GridSearchCVзKNeighborsClassifierяк базовим оцінювачем іparam_gridяк параметрами. - Побудувати конвеєр, що складається з:
ColumnTransformer(ct);SimpleImputer(strategy ='most_frequent');StandardScaler;- і
GridSearchCVяк фінального кроку.
- Навчити конвеєр на тренувальних даних (
X_train,y_train). - Оцінити модель на тестових даних, вивівши її
.score(X_test, y_test). - Передбачити на тестовій вибірці та вивести перші 5 декодованих передбачень за допомогою
label_enc.inverse_transform(). - Нарешті, вивести найкращий оцінювач, знайдений за допомогою
GridSearchCV.
Рішення
Дякуємо за ваш відгук!
single