Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split()
, яку слід використати.
А також нагадування про функцію mean_squared_error()
, яка потрібна для обчислення RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Призначте DataFrame з однією колонкою
'age'
зdf
зміннійX
. - Попередньо обробіть
X
за допомогою класуPolynomialFeatures
. - Розділіть набір даних за допомогою відповідної функції з
sklearn
. - Побудуйте та навчіть модель на тренувальному наборі.
- Передбачте цільові значення як для тренувального, так і для тестового набору.
- Обчисліть RMSE для тренувального та тестового набору.
- Виведіть підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше, ніж тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних відносно невеликий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) точки даних.
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain how to interpret RMSE values for training and test sets?
What does it mean if the test RMSE is lower than the training RMSE?
Can you provide an example of how to use train_test_split and mean_squared_error together?
Awesome!
Completion rate improved to 5.26
Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
Свайпніть щоб показати меню
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель перенавчається або недонавчається.
Нагадування про функцію train_test_split()
, яку слід використати.
А також нагадування про функцію mean_squared_error()
, яка потрібна для обчислення RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Призначте DataFrame з однією колонкою
'age'
зdf
зміннійX
. - Попередньо обробіть
X
за допомогою класуPolynomialFeatures
. - Розділіть набір даних за допомогою відповідної функції з
sklearn
. - Побудуйте та навчіть модель на тренувальному наборі.
- Передбачте цільові значення як для тренувального, так і для тестового набору.
- Обчисліть RMSE для тренувального та тестового набору.
- Виведіть підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше, ніж тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних відносно невеликий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) точки даних.
Дякуємо за ваш відгук!
single