Herausforderung: Preisvorhersage Mit Polynomregression
In dieser Aufgabe soll dasselbe Polynomialregressionsmodell zweiten Grades wie in der vorherigen Aufgabe erstellt werden. Allerdings muss der Datensatz in ein Trainings- und ein Testset aufgeteilt werden, um das RMSE für beide Sets zu berechnen. Dies ist notwendig, um zu beurteilen, ob das Modell über- oder unteranpasst ist.
Hier eine Erinnerung an die Funktion train_test_split(), die verwendet werden sollte.
Außerdem eine Erinnerung an die Funktion mean_squared_error() mit np.sqrt() zur Berechnung des RMSE:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Weisen Sie die DataFrame-Spalte
'age'vondfder VariablenXzu. - Verarbeiten Sie
Xmit der KlassePolynomialFeaturesvor. - Teilen Sie den Datensatz mit der entsprechenden Funktion aus
sklearn. - Erstellen und trainieren Sie ein Modell auf dem Trainingsdatensatz.
- Sagen Sie die Zielwerte sowohl für Trainings- als auch Testdatensatz voraus.
- Berechnen Sie das RMSE für Trainings- und Testdatensatz.
- Geben Sie die Zusammenfassungstabelle aus.
Lösung
Nach Abschluss der Aufgabe wird auffallen, dass das Test-RMSE sogar niedriger als das Trainings-RMSE ist. In der Regel zeigen Modelle auf unbekannten Daten keine besseren Ergebnisse. Hier ist der Unterschied jedoch sehr gering und zufallsbedingt. Unser Datensatz ist relativ klein, und beim Aufteilen hat das Testset etwas bessere (leichter vorherzusagende) Datenpunkte erhalten.
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 5.26
Herausforderung: Preisvorhersage Mit Polynomregression
Swipe um das Menü anzuzeigen
In dieser Aufgabe soll dasselbe Polynomialregressionsmodell zweiten Grades wie in der vorherigen Aufgabe erstellt werden. Allerdings muss der Datensatz in ein Trainings- und ein Testset aufgeteilt werden, um das RMSE für beide Sets zu berechnen. Dies ist notwendig, um zu beurteilen, ob das Modell über- oder unteranpasst ist.
Hier eine Erinnerung an die Funktion train_test_split(), die verwendet werden sollte.
Außerdem eine Erinnerung an die Funktion mean_squared_error() mit np.sqrt() zur Berechnung des RMSE:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Weisen Sie die DataFrame-Spalte
'age'vondfder VariablenXzu. - Verarbeiten Sie
Xmit der KlassePolynomialFeaturesvor. - Teilen Sie den Datensatz mit der entsprechenden Funktion aus
sklearn. - Erstellen und trainieren Sie ein Modell auf dem Trainingsdatensatz.
- Sagen Sie die Zielwerte sowohl für Trainings- als auch Testdatensatz voraus.
- Berechnen Sie das RMSE für Trainings- und Testdatensatz.
- Geben Sie die Zusammenfassungstabelle aus.
Lösung
Nach Abschluss der Aufgabe wird auffallen, dass das Test-RMSE sogar niedriger als das Trainings-RMSE ist. In der Regel zeigen Modelle auf unbekannten Daten keine besseren Ergebnisse. Hier ist der Unterschied jedoch sehr gering und zufallsbedingt. Unser Datensatz ist relativ klein, und beim Aufteilen hat das Testset etwas bessere (leichter vorherzusagende) Datenpunkte erhalten.
Danke für Ihr Feedback!
single