Herausforderung: Vorhersage von Immobilienpreisen
Sie erstellen nun ein Regressionsmodell anhand eines praxisnahen Beispiels. Ihnen steht eine Datei namens houses_simple.csv zur Verfügung, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Im nächsten Schritt werden Variablen zugewiesen und der Datensatz visualisiert:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Im Beispiel mit der Körpergröße einer Person war es deutlich einfacher, sich eine Linie vorzustellen, die die Daten gut abbildet.
Nun weist unsere Daten jedoch deutlich mehr Varianz auf, da das Ziel stark von vielen weiteren Faktoren wie Alter, Lage, Innenausstattung usw. abhängt.
Trotzdem besteht die Aufgabe darin, die Linie zu bestimmen, die die vorhandenen Daten am besten beschreibt; sie zeigt den Trend auf. Dafür sollte die Klasse OLS verwendet werden. Bald lernen wir, wie weitere Merkmale hinzugefügt werden können, um die Vorhersage zu verbessern!
Swipe to start coding
- Die Spalte
'price'ausdfalsyzuweisen. - Die Matrix
X_tildemit der Funktionadd_constant()ausstatsmodels(importiert alssm) erstellen. - Das
OLS-Objekt initialisieren und trainieren. - Das Array
X_newauf die gleiche Weise wieXvorverarbeiten. - Das Ziel für die Matrix
X_new_tildevorhersagen.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
What is the OLS class and how do I use it for regression?
Can you explain why adding more features improves prediction?
What does the scatter plot tell us about the data?
Awesome!
Completion rate improved to 5.26
Herausforderung: Vorhersage von Immobilienpreisen
Swipe um das Menü anzuzeigen
Sie erstellen nun ein Regressionsmodell anhand eines praxisnahen Beispiels. Ihnen steht eine Datei namens houses_simple.csv zur Verfügung, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Im nächsten Schritt werden Variablen zugewiesen und der Datensatz visualisiert:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Im Beispiel mit der Körpergröße einer Person war es deutlich einfacher, sich eine Linie vorzustellen, die die Daten gut abbildet.
Nun weist unsere Daten jedoch deutlich mehr Varianz auf, da das Ziel stark von vielen weiteren Faktoren wie Alter, Lage, Innenausstattung usw. abhängt.
Trotzdem besteht die Aufgabe darin, die Linie zu bestimmen, die die vorhandenen Daten am besten beschreibt; sie zeigt den Trend auf. Dafür sollte die Klasse OLS verwendet werden. Bald lernen wir, wie weitere Merkmale hinzugefügt werden können, um die Vorhersage zu verbessern!
Swipe to start coding
- Die Spalte
'price'ausdfalsyzuweisen. - Die Matrix
X_tildemit der Funktionadd_constant()ausstatsmodels(importiert alssm) erstellen. - Das
OLS-Objekt initialisieren und trainieren. - Das Array
X_newauf die gleiche Weise wieXvorverarbeiten. - Das Ziel für die Matrix
X_new_tildevorhersagen.
Lösung
Danke für Ihr Feedback!
single