Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split(), яку слід використати.
А також нагадування про функцію mean_squared_error(), яка потрібна для обчислення RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Призначте DataFrame з однією колонкою
'age'зdfзміннійX. - Попередньо обробіть
Xза допомогою класуPolynomialFeatures. - Розділіть набір даних за допомогою відповідної функції з
sklearn. - Побудуйте та навчіть модель на тренувальному наборі.
- Передбачте цільові значення як для тренувального, так і для тестового набору.
- Обчисліть RMSE для тренувального та тестового набору.
- Виведіть підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше, ніж тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних відносно невеликий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) точки даних.
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 5.26
Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
Свайпніть щоб показати меню
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split(), яку слід використати.
А також нагадування про функцію mean_squared_error(), яка потрібна для обчислення RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Призначте DataFrame з однією колонкою
'age'зdfзміннійX. - Попередньо обробіть
Xза допомогою класуPolynomialFeatures. - Розділіть набір даних за допомогою відповідної функції з
sklearn. - Побудуйте та навчіть модель на тренувальному наборі.
- Передбачте цільові значення як для тренувального, так і для тестового набору.
- Обчисліть RMSE для тренувального та тестового набору.
- Виведіть підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше, ніж тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних відносно невеликий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) точки даних.
Дякуємо за ваш відгук!
single