Desafío: Predicción de Precios Utilizando Regresión Polinómica
Para este desafío, se construirá la misma regresión polinómica de grado 2 que en el desafío anterior. Sin embargo, será necesario dividir el conjunto en un conjunto de entrenamiento y un conjunto de prueba para calcular el RMSE en ambos conjuntos. Esto es necesario para evaluar si el modelo presenta sobreajuste o subajuste.
A continuación, se recuerda la función train_test_split() que se debe utilizar.
También se recuerda la función mean_squared_error() junto con np.sqrt() necesaria para calcular el RMSE:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Asignar el DataFrame con una sola columna
'age'dedfa la variableX. - Preprocesar
Xutilizando la clasePolynomialFeatures. - Dividir el conjunto de datos utilizando la función apropiada de
sklearn. - Construir y entrenar un modelo en el conjunto de entrenamiento.
- Predecir los valores objetivo tanto del conjunto de entrenamiento como del conjunto de prueba.
- Calcular el RMSE para ambos conjuntos, entrenamiento y prueba.
- Imprimir la tabla resumen.
Solución
Al completar la tarea, se observará que el RMSE de prueba es incluso menor que el RMSE de entrenamiento. Por lo general, los modelos no muestran mejores resultados en instancias no vistas. En este caso, la diferencia es mínima y se debe al azar. Nuestro conjunto de datos es relativamente pequeño y, al dividirlo, el conjunto de prueba recibió puntos de datos ligeramente mejores (más fáciles de predecir).
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you explain how to use the train_test_split function in this context?
What is the formula for calculating RMSE, and why is it important?
How can I interpret the difference between training and test RMSE values?
Awesome!
Completion rate improved to 5.26
Desafío: Predicción de Precios Utilizando Regresión Polinómica
Desliza para mostrar el menú
Para este desafío, se construirá la misma regresión polinómica de grado 2 que en el desafío anterior. Sin embargo, será necesario dividir el conjunto en un conjunto de entrenamiento y un conjunto de prueba para calcular el RMSE en ambos conjuntos. Esto es necesario para evaluar si el modelo presenta sobreajuste o subajuste.
A continuación, se recuerda la función train_test_split() que se debe utilizar.
También se recuerda la función mean_squared_error() junto con np.sqrt() necesaria para calcular el RMSE:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Asignar el DataFrame con una sola columna
'age'dedfa la variableX. - Preprocesar
Xutilizando la clasePolynomialFeatures. - Dividir el conjunto de datos utilizando la función apropiada de
sklearn. - Construir y entrenar un modelo en el conjunto de entrenamiento.
- Predecir los valores objetivo tanto del conjunto de entrenamiento como del conjunto de prueba.
- Calcular el RMSE para ambos conjuntos, entrenamiento y prueba.
- Imprimir la tabla resumen.
Solución
Al completar la tarea, se observará que el RMSE de prueba es incluso menor que el RMSE de entrenamiento. Por lo general, los modelos no muestran mejores resultados en instancias no vistas. En este caso, la diferencia es mínima y se debe al azar. Nuestro conjunto de datos es relativamente pequeño y, al dividirlo, el conjunto de prueba recibió puntos de datos ligeramente mejores (más fáciles de predecir).
¡Gracias por tus comentarios!
single