Підсумок моделювання
Свайпніть щоб показати меню
Тепер ви знаєте, як створювати модель, використовувати конвеєри та налаштовувати гіперпараметри. Ви також ознайомилися з двома методами оцінювання: розділення на тренувальну та тестову вибірки і крос-валідація.
Наступний крок — поєднання оцінювання та налаштування за допомогою GridSearchCV або RandomizedSearchCV.
Оскільки наш набір даних дуже малий, ми будемо використовувати GridSearchCV, але все, що сказано нижче, також стосується і RandomizedSearchCV.
Оскільки крос-валідація є стабільнішою за просте розділення на тренувальну та тестову вибірки, мета — досягти найвищого балу крос-валідації.
GridSearchCV перебирає гіперпараметри та знаходить ті, що максимізують цей бал. Найкращий бал зберігається у .best_score_.
Гіперпараметри, які найкраще працюють для одного набору даних, можуть не узагальнюватися при появі нових даних.
Тому .best_score_ може бути вищим, ніж продуктивність моделі на повністю невідомих даних.
Поширений робочий процес: розділення на навчальний і тестовий набори; проведення крос-валідації на навчальному наборі для налаштування моделі; потім оцінка оптимізованої моделі на тестовому наборі для вимірювання продуктивності в реальних умовах.
Підсумок:
- Попередня обробка даних;
- Розділення на навчальну та тестову вибірки;
- Використання крос-валідації на навчальній вибірці для пошуку найкращої конфігурації;
- Оцінювання на тестовій вибірці.
Третій крок зазвичай передбачає тестування декількох алгоритмів і налаштування їхніх гіперпараметрів для визначення найкращого варіанту. Для спрощення в цьому курсі використовувався лише один алгоритм.
Крос-валідація не завжди є найкращим варіантом. Для великих наборів даних обчислення CV-оцінок стає затратним, тоді як розділення на навчальну і тестову вибірки стає більш стабільним завдяки великому тестовому набору.
Великі набори даних часто поділяються на навчальну, валідаційну та тестову вибірки. Гіперпараметри обираються на основі результатів на валідаційній вибірці. Нарешті, обрана модель оцінюється на тестовій вибірці для перевірки її здатності до узагальнення.
Набір даних penguins є невеликим і містить лише 342 записи. Через обмежений розмір для оцінювання у наступному розділі буде використано оцінку за допомогою крос-валідації.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат