Herausforderung: Vorhersage von Immobilienpreisen

Sie erstellen nun ein Regressionsmodell anhand eines praxisnahen Beispiels. Ihnen steht eine Datei namens houses_simple.csv zur Verfügung, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.


              1234
            
import pandas as pd

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
print(df.head())

Im nächsten Schritt werden Variablen zugewiesen und der Datensatz visualisiert:


              123456789
            
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
X = df['square_feet']
y = df['price']

plt.scatter(X, y, alpha=0.5)
plt.show()

Im Beispiel mit der Körpergröße einer Person war es deutlich einfacher, sich eine Linie vorzustellen, die die Daten gut abbildet.

Nun weist unsere Daten jedoch deutlich mehr Varianz auf, da das Ziel stark von vielen weiteren Faktoren wie Alter, Lage, Innenausstattung usw. abhängt. Dennoch besteht die Aufgabe darin, die Linie zu bestimmen, die die vorhandenen Daten am besten beschreibt; sie zeigt den Trend an. Dafür sollte die Klasse LinearRegression aus scikit-learn verwendet werden.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4

single

Swipe um das Menü anzuzeigen

Sie erstellen nun ein Regressionsmodell anhand eines praxisnahen Beispiels. Ihnen steht eine Datei namens houses_simple.csv zur Verfügung, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.


              1234
            
import pandas as pd

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
print(df.head())

Im nächsten Schritt werden Variablen zugewiesen und der Datensatz visualisiert:


              123456789
            
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
X = df['square_feet']
y = df['price']

plt.scatter(X, y, alpha=0.5)
plt.show()

Im Beispiel mit der Körpergröße einer Person war es deutlich einfacher, sich eine Linie vorzustellen, die die Daten gut abbildet.

Nun weist unsere Daten jedoch deutlich mehr Varianz auf, da das Ziel stark von vielen weiteren Faktoren wie Alter, Lage, Innenausstattung usw. abhängt. Dennoch besteht die Aufgabe darin, die Linie zu bestimmen, die die vorhandenen Daten am besten beschreibt; sie zeigt den Trend an. Dafür sollte die Klasse LinearRegression aus scikit-learn verwendet werden.

Aufgabe

Wischen, um mit dem Codieren zu beginnen

Die Spalte 'price' von df an y zuweisen.
Die Variable X_reshaped erstellen, indem X mit .values.reshape(-1, 1) in ein 2D-Array umgewandelt wird.
Das LinearRegression-Modell initialisieren und mit X_reshaped und y trainieren.
X_new_reshaped erstellen, indem X_new auf die gleiche Weise umgeformt wird.
Das Ziel für X_new_reshaped vorhersagen.

Lösung

Wechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4

single

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen