Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель переобучається або недообучається.
Нагадування про функцію train_test_split()
, яку слід використати.
А також нагадування про функцію mean_squared_error()
, яка потрібна для обчислення RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Призначити DataFrame з єдиною колонкою
'age'
зdf
зміннійX
. - Попередньо обробити
X
за допомогою класуPolynomialFeatures
. - Розділити набір даних за допомогою відповідної функції з
sklearn
. - Побудувати та навчити модель на тренувальному наборі.
- Передбачити цільові значення для тренувального та тестового наборів.
- Обчислити RMSE для тренувального та тестового наборів.
- Вивести підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше, ніж тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних досить малий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) дані.
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 5.26
Завдання: Прогнозування Цін за Допомогою Поліноміальної Регресії
Свайпніть щоб показати меню
У цьому завданні необхідно побудувати ту ж Поліноміальну регресію другого ступеня, що й у попередньому завданні. Однак потрібно розділити набір даних на тренувальний та тестовий набори, щоб обчислити RMSE для обох цих наборів. Це необхідно для оцінки, чи модель переобучається або недообучається.
Нагадування про функцію train_test_split()
, яку слід використати.
А також нагадування про функцію mean_squared_error()
, яка потрібна для обчислення RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Призначити DataFrame з єдиною колонкою
'age'
зdf
зміннійX
. - Попередньо обробити
X
за допомогою класуPolynomialFeatures
. - Розділити набір даних за допомогою відповідної функції з
sklearn
. - Побудувати та навчити модель на тренувальному наборі.
- Передбачити цільові значення для тренувального та тестового наборів.
- Обчислити RMSE для тренувального та тестового наборів.
- Вивести підсумкову таблицю.
Рішення
Після виконання завдання ви помітите, що тестове RMSE навіть менше, ніж тренувальне RMSE. Зазвичай моделі не демонструють кращих результатів на невідомих даних. У цьому випадку різниця незначна й обумовлена випадковістю. Наш набір даних досить малий, і під час розділення тестовий набір отримав трохи кращі (легші для прогнозування) дані.
Дякуємо за ваш відгук!
Awesome!
Completion rate improved to 5.26single