Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Prédiction des Prix Immobiliers | Régression Linéaire Simple
Régression Linéaire Avec Python

bookDéfi : Prédiction des Prix Immobiliers

Vous allez maintenant construire un modèle de régression appliqué à un exemple réel. Vous disposez d’un fichier, houses_simple.csv, qui contient des informations sur les prix des logements avec leur superficie comme caractéristique.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
copy

L’étape suivante consiste à attribuer des variables et à visualiser l’ensemble de données :

123456789
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
copy

Dans l'exemple concernant la taille d'une personne, il était beaucoup plus facile d'imaginer une droite s'ajustant bien aux données.

Cependant, nos données présentent désormais beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs tels que l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données disponibles ; elle indiquera la tendance. La classe OLS doit être utilisée à cet effet. Nous apprendrons bientôt comment ajouter davantage de variables, ce qui améliorera la prédiction !

Tâche

Swipe to start coding

  1. Assigner la colonne 'price' de df à y.
  2. Créer la matrice X_tilde en utilisant la fonction add_constant() de statsmodels (importée sous le nom sm).
  3. Initialiser l'objet OLS et l'entraîner.
  4. Prétraiter le tableau X_new de la même manière que X.
  5. Prédire la cible pour la matrice X_new_tilde.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 5
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

What is the OLS class and how do I use it for regression?

Can you explain why adding more features improves prediction?

What does the scatter plot tell us about the data?

close

Awesome!

Completion rate improved to 5.26

bookDéfi : Prédiction des Prix Immobiliers

Glissez pour afficher le menu

Vous allez maintenant construire un modèle de régression appliqué à un exemple réel. Vous disposez d’un fichier, houses_simple.csv, qui contient des informations sur les prix des logements avec leur superficie comme caractéristique.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
copy

L’étape suivante consiste à attribuer des variables et à visualiser l’ensemble de données :

123456789
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
copy

Dans l'exemple concernant la taille d'une personne, il était beaucoup plus facile d'imaginer une droite s'ajustant bien aux données.

Cependant, nos données présentent désormais beaucoup plus de variance, car la variable cible dépend fortement de nombreux autres facteurs tels que l'âge, l'emplacement, l'intérieur, etc.
Quoi qu'il en soit, l'objectif est de construire la droite qui s'ajuste le mieux aux données disponibles ; elle indiquera la tendance. La classe OLS doit être utilisée à cet effet. Nous apprendrons bientôt comment ajouter davantage de variables, ce qui améliorera la prédiction !

Tâche

Swipe to start coding

  1. Assigner la colonne 'price' de df à y.
  2. Créer la matrice X_tilde en utilisant la fonction add_constant() de statsmodels (importée sous le nom sm).
  3. Initialiser l'objet OLS et l'entraîner.
  4. Prétraiter le tableau X_new de la même manière que X.
  5. Prédire la cible pour la matrice X_new_tilde.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 5
single

single

some-alt