Kursinhalt
Lineare Regression mit Python
Lineare Regression mit Python
Preise mit Polynomialer Regression Vorhersagen
Für diese Herausforderung werden Sie die gleiche Polynomialregression vom Grad 2 wie in der vorherigen Herausforderung erstellen. Sie müssen jedoch den Satz in einen Trainingssatz und einen Testsatz aufteilen, um den RMSE für beide Sätze zu berechnen. Dies ist erforderlich, um zu beurteilen, ob das Modell überanpasst oder unteranpasst ist.
Hier ist die Erinnerung an die train_test_split()
-Funktion, die Sie verwenden möchten.
Und auch die Erinnerung an die mean_squared_error()
-Funktion, die benötigt wird, um den RMSE zu berechnen:
Jetzt gehen wir zum Codieren über!
Swipe to start coding
- Weisen Sie die DataFrame mit einer einzelnen Spalte
'age'
vondf
der VariablenX
zu. - Verarbeiten Sie
X
mit der KlassePolynomialFeatures
vor. - Teilen Sie den Datensatz mit der entsprechenden Funktion aus
sklearn
. - Erstellen und trainieren Sie ein Modell auf dem Trainingssatz.
- Sagen Sie die Ziele sowohl des Trainings- als auch des Testsatzes voraus.
- Berechnen Sie den RMSE für sowohl den Trainings- als auch den Testsatz.
- Drucken Sie die Zusammenfassungstabelle aus.
Lösung
Wenn Sie die Aufgabe abgeschlossen haben, werden Sie feststellen, dass der Test-RMSE sogar niedriger ist als der Trainings-RMSE. Normalerweise zeigen Modelle keine besseren Ergebnisse bei unbekannten Instanzen. Hier ist der Unterschied gering und zufallsbedingt. Unser Datensatz ist relativ klein, und beim Teilen hat der Testsatz etwas bessere (leichter vorherzusagende) Datenpunkte erhalten.
Danke für Ihr Feedback!
Preise mit Polynomialer Regression Vorhersagen
Für diese Herausforderung werden Sie die gleiche Polynomialregression vom Grad 2 wie in der vorherigen Herausforderung erstellen. Sie müssen jedoch den Satz in einen Trainingssatz und einen Testsatz aufteilen, um den RMSE für beide Sätze zu berechnen. Dies ist erforderlich, um zu beurteilen, ob das Modell überanpasst oder unteranpasst ist.
Hier ist die Erinnerung an die train_test_split()
-Funktion, die Sie verwenden möchten.
Und auch die Erinnerung an die mean_squared_error()
-Funktion, die benötigt wird, um den RMSE zu berechnen:
Jetzt gehen wir zum Codieren über!
Swipe to start coding
- Weisen Sie die DataFrame mit einer einzelnen Spalte
'age'
vondf
der VariablenX
zu. - Verarbeiten Sie
X
mit der KlassePolynomialFeatures
vor. - Teilen Sie den Datensatz mit der entsprechenden Funktion aus
sklearn
. - Erstellen und trainieren Sie ein Modell auf dem Trainingssatz.
- Sagen Sie die Ziele sowohl des Trainings- als auch des Testsatzes voraus.
- Berechnen Sie den RMSE für sowohl den Trainings- als auch den Testsatz.
- Drucken Sie die Zusammenfassungstabelle aus.
Lösung
Wenn Sie die Aufgabe abgeschlossen haben, werden Sie feststellen, dass der Test-RMSE sogar niedriger ist als der Trainings-RMSE. Normalerweise zeigen Modelle keine besseren Ergebnisse bei unbekannten Instanzen. Hier ist der Unterschied gering und zufallsbedingt. Unser Datensatz ist relativ klein, und beim Teilen hat der Testsatz etwas bessere (leichter vorherzusagende) Datenpunkte erhalten.
Danke für Ihr Feedback!