Prédire les Prix en Utilisant Deux Caractéristiques
Pour ce défi, le même jeu de données sur le logement sera utilisé. Cependant, il a maintenant deux caractéristiques : l'âge et la superficie de la maison (colonnes age
et square_feet
).
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houseprices.csv') print(df.head())
Votre tâche est de construire un modèle de régression linéaire multiple en utilisant la classe OLS
. De plus, vous imprimerez le tableau récapitulatif pour examiner les valeurs p de chaque caractéristique.
Tâche
Swipe to start coding
- Assignez les colonnes
'age'
et'square_feet'
dedf
àX
. - Prétraitez
X
pour le constructeur de classeOLS
. - Construisez et entraînez le modèle en utilisant la classe
OLS
. - Prétraitez le tableau
X_new
de la même manière queX
. - Prédisez la cible pour
X_new
. - Imprimez le tableau récapitulatif du modèle.
Solution
Si vous avez tout fait correctement, vous avez obtenu des p-valeurs proches de zéro. Cela signifie que toutes nos caractéristiques sont significatives pour le modèle.
Tout était clair ?
Merci pour vos commentaires !
Section 2. Chapitre 5