Défi : Prédire les Prix en Utilisant Deux Variables
Pour ce défi, le même jeu de données sur le logement sera utilisé. Cependant, il comporte désormais deux caractéristiques : l'âge et la superficie de la maison (colonnes 'age'
et 'square_feet'
).
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houseprices.csv') print(df.head())
Votre tâche consiste à construire un modèle de régression linéaire multiple en utilisant la classe OLS
. Vous afficherez également le tableau récapitulatif afin d'examiner les p-values de chaque caractéristique.
Tâche
Swipe to start coding
- Assigner les colonnes
'age'
et'square_feet'
dedf
àX
. - Prétraiter
X
pour le constructeur de la classeOLS
. - Construire et entraîner le modèle en utilisant la classe
OLS
. - Prétraiter le tableau
X_new
de la même manière queX
. - Prédire la cible pour
X_new
. - Afficher le tableau récapitulatif du modèle.
Solution
Si vous avez tout fait correctement, vous avez obtenu des p-valeurs proches de zéro. Cela signifie que toutes nos variables explicatives sont significatives pour le modèle.
Tout était clair ?
Merci pour vos commentaires !