Défi : Prédire les Prix à l'Aide de la Régression Polynomiale
Pour ce défi, il s'agit de construire la même régression polynomiale de degré 2 que dans le défi précédent. Cependant, il sera nécessaire de diviser l'ensemble en un ensemble d'entraînement et un ensemble de test afin de calculer la RMSE pour ces deux ensembles. Ceci est requis pour évaluer si le modèle présente un surapprentissage ou un sous-apprentissage.
Voici un rappel de la fonction train_test_split() à utiliser.
Et également un rappel de la fonction mean_squared_error() avec np.sqrt() nécessaire pour calculer la RMSE :
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Assigner la DataFrame contenant uniquement la colonne
'age'dedfà la variableX. - Prétraiter
Xen utilisant la classePolynomialFeatures. - Diviser l'ensemble de données à l'aide de la fonction appropriée de
sklearn. - Construire et entraîner un modèle sur l'ensemble d'entraînement.
- Prédire les cibles pour les ensembles d'entraînement et de test.
- Calculer la RMSE pour les ensembles d'entraînement et de test.
- Afficher le tableau récapitulatif.
Solution
Une fois la tâche terminée, il sera constaté que la RMSE du test est même inférieure à celle de l'entraînement. Habituellement, les modèles n'obtiennent pas de meilleurs résultats sur des instances non vues. Ici, la différence est minime et due au hasard. Notre jeu de données est relativement petit et, lors de la division, l'ensemble de test a reçu des points de données légèrement meilleurs (plus faciles à prédire).
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain how to use the train_test_split function in this context?
What is the formula for calculating RMSE, and why is it important?
How can I interpret the difference between training and test RMSE values?
Awesome!
Completion rate improved to 5.26
Défi : Prédire les Prix à l'Aide de la Régression Polynomiale
Glissez pour afficher le menu
Pour ce défi, il s'agit de construire la même régression polynomiale de degré 2 que dans le défi précédent. Cependant, il sera nécessaire de diviser l'ensemble en un ensemble d'entraînement et un ensemble de test afin de calculer la RMSE pour ces deux ensembles. Ceci est requis pour évaluer si le modèle présente un surapprentissage ou un sous-apprentissage.
Voici un rappel de la fonction train_test_split() à utiliser.
Et également un rappel de la fonction mean_squared_error() avec np.sqrt() nécessaire pour calculer la RMSE :
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Assigner la DataFrame contenant uniquement la colonne
'age'dedfà la variableX. - Prétraiter
Xen utilisant la classePolynomialFeatures. - Diviser l'ensemble de données à l'aide de la fonction appropriée de
sklearn. - Construire et entraîner un modèle sur l'ensemble d'entraînement.
- Prédire les cibles pour les ensembles d'entraînement et de test.
- Calculer la RMSE pour les ensembles d'entraînement et de test.
- Afficher le tableau récapitulatif.
Solution
Une fois la tâche terminée, il sera constaté que la RMSE du test est même inférieure à celle de l'entraînement. Habituellement, les modèles n'obtiennent pas de meilleurs résultats sur des instances non vues. Ici, la différence est minime et due au hasard. Notre jeu de données est relativement petit et, lors de la division, l'ensemble de test a reçu des points de données légèrement meilleurs (plus faciles à prédire).
Merci pour vos commentaires !
single