Défi : Prédire les Prix des Maisons
Vous allez maintenant construire un modèle de régression basé sur un exemple réel. Vous disposez d'un fichier, houses_simple.csv
, qui contient des informations sur les prix des logements avec leur superficie comme caractéristique.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
L'étape suivante consiste à attribuer des variables et à visualiser l'ensemble de données :
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Dans l'exemple de la taille d'une personne, il était beaucoup plus facile d'imaginer une droite ajustant bien les données.
Mais ici, nos données présentent beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs comme l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données disponibles ; elle indiquera la tendance. La classe OLS
doit être utilisée pour cela. Bientôt, nous apprendrons comment ajouter plus de variables, ce qui améliorera la prédiction !
Swipe to start coding
- Assigner la colonne
'price'
dedf
ày
. - Créer la matrice
X_tilde
en utilisant la fonctionadd_constant()
destatsmodels
(importée sous le nomsm
). - Initialiser l'objet
OLS
et l'entraîner. - Prétraiter le tableau
X_new
de la même manière queX
. - Prédire la cible pour la matrice
X_new_tilde
.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 5.26
Défi : Prédire les Prix des Maisons
Glissez pour afficher le menu
Vous allez maintenant construire un modèle de régression basé sur un exemple réel. Vous disposez d'un fichier, houses_simple.csv
, qui contient des informations sur les prix des logements avec leur superficie comme caractéristique.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
L'étape suivante consiste à attribuer des variables et à visualiser l'ensemble de données :
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Dans l'exemple de la taille d'une personne, il était beaucoup plus facile d'imaginer une droite ajustant bien les données.
Mais ici, nos données présentent beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs comme l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données disponibles ; elle indiquera la tendance. La classe OLS
doit être utilisée pour cela. Bientôt, nous apprendrons comment ajouter plus de variables, ce qui améliorera la prédiction !
Swipe to start coding
- Assigner la colonne
'price'
dedf
ày
. - Créer la matrice
X_tilde
en utilisant la fonctionadd_constant()
destatsmodels
(importée sous le nomsm
). - Initialiser l'objet
OLS
et l'entraîner. - Prétraiter le tableau
X_new
de la même manière queX
. - Prédire la cible pour la matrice
X_new_tilde
.
Solution
Merci pour vos commentaires !
Awesome!
Completion rate improved to 5.26single