Contenu du cours
Régression Linéaire Avec Python
Régression Linéaire Avec Python
Prédire les Prix en Utilisant la Régression Polynomiale
Pour ce défi, vous allez construire la même régression polynomiale de degré 2 que dans le défi précédent. Cependant, vous devrez diviser l'ensemble en un ensemble d'entraînement et un ensemble de test pour calculer le RMSE pour ces deux ensembles. Cela est nécessaire pour juger si le modèle surajuste/sous-ajuste ou non.
Voici le rappel de la fonction train_test_split()
que vous voudrez utiliser.
Et aussi un rappel de la fonction mean_squared_error()
nécessaire pour calculer le RMSE :
Passons maintenant au codage !
Swipe to start coding
- Assignez le DataFrame avec une seule colonne
'age'
dedf
à la variableX
. - Prétraitez le
X
en utilisant la classePolynomialFeatures
. - Divisez le jeu de données en utilisant la fonction appropriée de
sklearn
. - Construisez et entraînez un modèle sur le jeu d'entraînement.
- Prédisez les cibles des ensembles d'entraînement et de test.
- Calculez le RMSE pour les ensembles d'entraînement et de test.
- Imprimez le tableau récapitulatif.
Solution
Lorsque vous terminez la tâche, vous remarquerez que le RMSE de test est même inférieur au RMSE d'entraînement. Habituellement, les modèles ne montrent pas de meilleurs résultats sur des instances non vues. Ici, la différence est minime et causée par le hasard. Notre jeu de données est relativement petit, et lors de la division, le jeu de test a reçu des points de données un peu meilleurs (plus faciles à prédire).
Merci pour vos commentaires !
Prédire les Prix en Utilisant la Régression Polynomiale
Pour ce défi, vous allez construire la même régression polynomiale de degré 2 que dans le défi précédent. Cependant, vous devrez diviser l'ensemble en un ensemble d'entraînement et un ensemble de test pour calculer le RMSE pour ces deux ensembles. Cela est nécessaire pour juger si le modèle surajuste/sous-ajuste ou non.
Voici le rappel de la fonction train_test_split()
que vous voudrez utiliser.
Et aussi un rappel de la fonction mean_squared_error()
nécessaire pour calculer le RMSE :
Passons maintenant au codage !
Swipe to start coding
- Assignez le DataFrame avec une seule colonne
'age'
dedf
à la variableX
. - Prétraitez le
X
en utilisant la classePolynomialFeatures
. - Divisez le jeu de données en utilisant la fonction appropriée de
sklearn
. - Construisez et entraînez un modèle sur le jeu d'entraînement.
- Prédisez les cibles des ensembles d'entraînement et de test.
- Calculez le RMSE pour les ensembles d'entraînement et de test.
- Imprimez le tableau récapitulatif.
Solution
Lorsque vous terminez la tâche, vous remarquerez que le RMSE de test est même inférieur au RMSE d'entraînement. Habituellement, les modèles ne montrent pas de meilleurs résultats sur des instances non vues. Ici, la différence est minime et causée par le hasard. Notre jeu de données est relativement petit, et lors de la division, le jeu de test a reçu des points de données un peu meilleurs (plus faciles à prédire).
Merci pour vos commentaires !