Swipe um das Menü anzuzeigen

Hauspreise Vorhersagen

Lassen Sie uns ein Regressionsmodell für ein reales Beispiel erstellen. Wir haben eine Datei, houses_simple.csv, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.


              1234
            
import pandas as pd

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
print(df.head())

Lassen Sie uns Variablen zuweisen und unser Datenset visualisieren!


              12345678
            
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
X = df['square_feet']
y = df['price']

plt.scatter(X, y, alpha=0.5)

Im Beispiel mit der Körpergröße einer Person war es viel einfacher, sich eine Linie vorzustellen, die gut zu den Daten passt.
Aber jetzt haben unsere Daten viel mehr Varianz, da das Ziel stark von vielen anderen Dingen wie Alter, Standort, Innenausstattung usw. abhängt.
Dennoch besteht die Aufgabe darin, die Linie zu erstellen, die am besten zu den vorhandenen Daten passt; sie wird den Trend zeigen. Die OLS-Klasse sollte dafür verwendet werden. Bald werden wir lernen, wie man mehr Merkmale hinzufügt, um die Vorhersage zu verbessern!

Aufgabe

Swipe to start coding

Weisen Sie die 'price'-Spalte von df y zu.
Erstellen Sie die X_tilde-Matrix mit der add_constant()-Funktion von statsmodels (importiert als sm).
Initialisieren Sie das OLS-Objekt und trainieren Sie es.
Verarbeiten Sie das X_new-Array auf die gleiche Weise wie X.
Sagen Sie das Ziel für die X_new_tilde-Matrix voraus.

_{Sobald Sie diese Aufgabe abgeschlossen haben, klicken Sie auf die -Schaltfläche unter dem Code, um Ihre Lösung zu überprüfen.}

Lösung

Wechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 5

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Hauspreise Vorhersagen

Lassen Sie uns ein Regressionsmodell für ein reales Beispiel erstellen. Wir haben eine Datei, houses_simple.csv, die Informationen über Immobilienpreise mit der Fläche als Merkmal enthält.


              1234
            
import pandas as pd

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
print(df.head())

Lassen Sie uns Variablen zuweisen und unser Datenset visualisieren!


              12345678
            
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv')
X = df['square_feet']
y = df['price']

plt.scatter(X, y, alpha=0.5)

Aufgabe

Swipe to start coding

Weisen Sie die 'price'-Spalte von df y zu.
Erstellen Sie die X_tilde-Matrix mit der add_constant()-Funktion von statsmodels (importiert als sm).
Initialisieren Sie das OLS-Objekt und trainieren Sie es.
Verarbeiten Sie das X_new-Array auf die gleiche Weise wie X.
Sagen Sie das Ziel für die X_new_tilde-Matrix voraus.

_{Sobald Sie diese Aufgabe abgeschlossen haben, klicken Sie auf die -Schaltfläche unter dem Code, um Ihre Lösung zu überprüfen.}

Lösung

Wechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 5

Wechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden