Desafío: Predicción de Precios Utilizando Regresión Polinómica
Para este desafío, construirá la misma regresión polinómica de grado 2 que en el desafío anterior. Sin embargo, deberá dividir el conjunto en un conjunto de entrenamiento y un conjunto de prueba para calcular el RMSE para ambos conjuntos. Esto es necesario para evaluar si el modelo sobreajusta o subajusta.
Aquí tiene un recordatorio de la función train_test_split()
que querrá utilizar.
Y también un recordatorio de la función mean_squared_error()
necesaria para calcular el RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Asignar el DataFrame con una sola columna
'age'
dedf
a la variableX
. - Preprocesar
X
utilizando la clasePolynomialFeatures
. - Dividir el conjunto de datos usando la función apropiada de
sklearn
. - Construir y entrenar un modelo en el conjunto de entrenamiento.
- Predecir los valores objetivo tanto del conjunto de entrenamiento como del conjunto de prueba.
- Calcular el RMSE para ambos conjuntos, entrenamiento y prueba.
- Imprimir la tabla de resumen.
Solución
Al completar la tarea, notará que el RMSE de prueba es incluso menor que el RMSE de entrenamiento. Por lo general, los modelos no muestran mejores resultados en instancias no vistas. Aquí, la diferencia es mínima y se debe al azar. Nuestro conjunto de datos es relativamente pequeño y, al dividirlo, el conjunto de prueba recibió puntos de datos un poco mejores (más fáciles de predecir).
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 5.26
Desafío: Predicción de Precios Utilizando Regresión Polinómica
Desliza para mostrar el menú
Para este desafío, construirá la misma regresión polinómica de grado 2 que en el desafío anterior. Sin embargo, deberá dividir el conjunto en un conjunto de entrenamiento y un conjunto de prueba para calcular el RMSE para ambos conjuntos. Esto es necesario para evaluar si el modelo sobreajusta o subajusta.
Aquí tiene un recordatorio de la función train_test_split()
que querrá utilizar.
Y también un recordatorio de la función mean_squared_error()
necesaria para calcular el RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Asignar el DataFrame con una sola columna
'age'
dedf
a la variableX
. - Preprocesar
X
utilizando la clasePolynomialFeatures
. - Dividir el conjunto de datos usando la función apropiada de
sklearn
. - Construir y entrenar un modelo en el conjunto de entrenamiento.
- Predecir los valores objetivo tanto del conjunto de entrenamiento como del conjunto de prueba.
- Calcular el RMSE para ambos conjuntos, entrenamiento y prueba.
- Imprimir la tabla de resumen.
Solución
Al completar la tarea, notará que el RMSE de prueba es incluso menor que el RMSE de entrenamiento. Por lo general, los modelos no muestran mejores resultados en instancias no vistas. Aquí, la diferencia es mínima y se debe al azar. Nuestro conjunto de datos es relativamente pequeño y, al dividirlo, el conjunto de prueba recibió puntos de datos un poco mejores (más fáciles de predecir).
¡Gracias por tus comentarios!
Awesome!
Completion rate improved to 5.26single