Défi : Prédiction des Prix Immobiliers
Vous allez maintenant construire un modèle de régression appliqué à un exemple réel. Vous disposez d’un fichier, houses_simple.csv, qui contient des informations sur les prix des logements avec leur superficie comme caractéristique.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
L’étape suivante consiste à attribuer des variables et à visualiser l’ensemble de données :
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Dans l'exemple concernant la taille d'une personne, il était beaucoup plus facile d'imaginer une droite s'ajustant bien aux données.
Cependant, nos données présentent désormais beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs tels que l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données disponibles ; elle indiquera la tendance. La classe OLS doit être utilisée à cet effet. Nous apprendrons bientôt comment ajouter davantage de variables, ce qui améliorera la prédiction !
Swipe to start coding
- Assigner la colonne
'price'dedfày. - Créer la matrice
X_tildeen utilisant la fonctionadd_constant()destatsmodels(importée sous le nomsm). - Initialiser l'objet
OLSet l'entraîner. - Prétraiter le tableau
X_newde la même manière queX. - Prédire la cible pour la matrice
X_new_tilde.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
What is the OLS class and how do I use it for regression?
Can you explain why adding more features improves prediction?
What does the scatter plot tell us about the data?
Awesome!
Completion rate improved to 5.26
Défi : Prédiction des Prix Immobiliers
Glissez pour afficher le menu
Vous allez maintenant construire un modèle de régression appliqué à un exemple réel. Vous disposez d’un fichier, houses_simple.csv, qui contient des informations sur les prix des logements avec leur superficie comme caractéristique.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
L’étape suivante consiste à attribuer des variables et à visualiser l’ensemble de données :
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Dans l'exemple concernant la taille d'une personne, il était beaucoup plus facile d'imaginer une droite s'ajustant bien aux données.
Cependant, nos données présentent désormais beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs tels que l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données disponibles ; elle indiquera la tendance. La classe OLS doit être utilisée à cet effet. Nous apprendrons bientôt comment ajouter davantage de variables, ce qui améliorera la prédiction !
Swipe to start coding
- Assigner la colonne
'price'dedfày. - Créer la matrice
X_tildeen utilisant la fonctionadd_constant()destatsmodels(importée sous le nomsm). - Initialiser l'objet
OLSet l'entraîner. - Prétraiter le tableau
X_newde la même manière queX. - Prédire la cible pour la matrice
X_new_tilde.
Solution
Merci pour vos commentaires !
single