Défi : Prédire les Prix des Maisons
Vous allez maintenant construire un modèle de régression appliqué à un exemple réel. Vous disposez d’un fichier, houses_simple.csv, qui contient des informations sur les prix de l’immobilier avec la superficie comme caractéristique.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
L’étape suivante consiste à attribuer des variables et à visualiser l’ensemble de données :
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Dans l'exemple de la taille d'une personne, il était beaucoup plus facile d'imaginer une droite s'ajustant bien aux données.
Mais maintenant, nos données présentent beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs comme l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données dont nous disposons ; elle indiquera la tendance. La classe LinearRegression de scikit-learn doit être utilisée à cet effet.
Swipe to start coding
- Assigner la colonne
'price'dedfày. - Créer la variable
X_reshapeden remodelantXen un tableau 2D avec.values.reshape(-1, 1). - Initialiser le modèle
LinearRegressionet l'entraîner en utilisantX_reshapedety. - Créer
X_new_reshapeden remodelantX_newde la même manière. - Prédire la cible pour
X_new_reshaped.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 3.33
Défi : Prédire les Prix des Maisons
Glissez pour afficher le menu
Vous allez maintenant construire un modèle de régression appliqué à un exemple réel. Vous disposez d’un fichier, houses_simple.csv, qui contient des informations sur les prix de l’immobilier avec la superficie comme caractéristique.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
L’étape suivante consiste à attribuer des variables et à visualiser l’ensemble de données :
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Dans l'exemple de la taille d'une personne, il était beaucoup plus facile d'imaginer une droite s'ajustant bien aux données.
Mais maintenant, nos données présentent beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs comme l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données dont nous disposons ; elle indiquera la tendance. La classe LinearRegression de scikit-learn doit être utilisée à cet effet.
Swipe to start coding
- Assigner la colonne
'price'dedfày. - Créer la variable
X_reshapeden remodelantXen un tableau 2D avec.values.reshape(-1, 1). - Initialiser le modèle
LinearRegressionet l'entraîner en utilisantX_reshapedety. - Créer
X_new_reshapeden remodelantX_newde la même manière. - Prédire la cible pour
X_new_reshaped.
Solution
Merci pour vos commentaires !
single