Contenu du cours
Régression Linéaire Avec Python
Régression Linéaire Avec Python
Prédire les Prix des Maisons
Construisons un modèle de régression d'exemple du monde réel. Nous avons un fichier, houses_simple.csv
, qui contient des informations sur les prix des logements avec sa superficie comme caractéristique.
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Attribuons des variables et visualisons notre jeu de données !
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5)
Dans l'exemple avec la taille d'une personne, il était beaucoup plus facile d'imaginer une ligne s'ajustant bien aux données.
Mais maintenant, nos données ont beaucoup plus de variance puisque la cible dépend fortement de nombreux autres facteurs comme l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, la tâche consiste à construire la ligne qui s'ajuste le mieux aux données que nous avons ; elle montrera la tendance. La classe OLS
doit être utilisée pour cela. Bientôt, nous apprendrons comment ajouter plus de caractéristiques, cela rendra la prédiction meilleure !
Swipe to start coding
- Assignez la colonne
'price'
dedf
ày
. - Créez la matrice
X_tilde
en utilisant la fonctionadd_constant()
destatsmodels
(importée sous le nomsm
). - Initialisez l'objet
OLS
et entraînez-le. - Prétraitez le tableau
X_new
de la même manière queX
. - Prédisez la cible pour la matrice
X_new_tilde
.
Une fois que vous avez terminé cette tâche, cliquez sur le bouton sous le code pour vérifier votre solution.
Solution
Merci pour vos commentaires !
Prédire les Prix des Maisons
Construisons un modèle de régression d'exemple du monde réel. Nous avons un fichier, houses_simple.csv
, qui contient des informations sur les prix des logements avec sa superficie comme caractéristique.
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Attribuons des variables et visualisons notre jeu de données !
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5)
Dans l'exemple avec la taille d'une personne, il était beaucoup plus facile d'imaginer une ligne s'ajustant bien aux données.
Mais maintenant, nos données ont beaucoup plus de variance puisque la cible dépend fortement de nombreux autres facteurs comme l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, la tâche consiste à construire la ligne qui s'ajuste le mieux aux données que nous avons ; elle montrera la tendance. La classe OLS
doit être utilisée pour cela. Bientôt, nous apprendrons comment ajouter plus de caractéristiques, cela rendra la prédiction meilleure !
Swipe to start coding
- Assignez la colonne
'price'
dedf
ày
. - Créez la matrice
X_tilde
en utilisant la fonctionadd_constant()
destatsmodels
(importée sous le nomsm
). - Initialisez l'objet
OLS
et entraînez-le. - Prétraitez le tableau
X_new
de la même manière queX
. - Prédisez la cible pour la matrice
X_new_tilde
.
Une fois que vous avez terminé cette tâche, cliquez sur le bouton sous le code pour vérifier votre solution.
Solution
Merci pour vos commentaires !