Herausforderung: Vorhersage von Immobilienpreisen
Sie erstellen nun ein Regressionsmodell anhand eines praxisnahen Beispiels. Ihnen steht eine Datei namens houses_simple.csv zur Verfügung, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Im nächsten Schritt werden Variablen zugewiesen und der Datensatz visualisiert:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Im Beispiel mit der Körpergröße einer Person war es deutlich einfacher, sich eine Linie vorzustellen, die die Daten gut abbildet.
Nun weist unsere Daten jedoch deutlich mehr Varianz auf, da das Ziel stark von vielen weiteren Faktoren wie Alter, Lage, Innenausstattung usw. abhängt.
Dennoch besteht die Aufgabe darin, die Linie zu bestimmen, die die vorhandenen Daten am besten beschreibt; sie zeigt den Trend an. Dafür sollte die Klasse LinearRegression aus scikit-learn verwendet werden.
Swipe to start coding
- Die Spalte
'price'vondfanyzuweisen. - Die Variable
X_reshapederstellen, indemXmit.values.reshape(-1, 1)in ein 2D-Array umgewandelt wird. - Das
LinearRegression-Modell initialisieren und mitX_reshapedundytrainieren. X_new_reshapederstellen, indemX_newauf die gleiche Weise umgeformt wird.- Das Ziel für
X_new_reshapedvorhersagen.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 3.33
Herausforderung: Vorhersage von Immobilienpreisen
Swipe um das Menü anzuzeigen
Sie erstellen nun ein Regressionsmodell anhand eines praxisnahen Beispiels. Ihnen steht eine Datei namens houses_simple.csv zur Verfügung, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Im nächsten Schritt werden Variablen zugewiesen und der Datensatz visualisiert:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Im Beispiel mit der Körpergröße einer Person war es deutlich einfacher, sich eine Linie vorzustellen, die die Daten gut abbildet.
Nun weist unsere Daten jedoch deutlich mehr Varianz auf, da das Ziel stark von vielen weiteren Faktoren wie Alter, Lage, Innenausstattung usw. abhängt.
Dennoch besteht die Aufgabe darin, die Linie zu bestimmen, die die vorhandenen Daten am besten beschreibt; sie zeigt den Trend an. Dafür sollte die Klasse LinearRegression aus scikit-learn verwendet werden.
Swipe to start coding
- Die Spalte
'price'vondfanyzuweisen. - Die Variable
X_reshapederstellen, indemXmit.values.reshape(-1, 1)in ein 2D-Array umgewandelt wird. - Das
LinearRegression-Modell initialisieren und mitX_reshapedundytrainieren. X_new_reshapederstellen, indemX_newauf die gleiche Weise umgeformt wird.- Das Ziel für
X_new_reshapedvorhersagen.
Lösung
Danke für Ihr Feedback!
single