Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Preisvorhersage mit Polynomregression | Auswahl des Besten Modells
Lineare Regression mit Python

bookHerausforderung: Preisvorhersage mit Polynomregression

In dieser Aufgabe wird dasselbe Polynomialregressionsmodell zweiten Grades wie in der vorherigen Aufgabe erstellt. Allerdings muss der Datensatz in ein Trainings- und ein Testset aufgeteilt werden, um den RMSE für beide Sets zu berechnen. Dies ist notwendig, um zu beurteilen, ob das Modell über- oder unteranpasst ist.
Hier eine Erinnerung an die Funktion train_test_split(), die verwendet werden soll.

Außerdem eine Erinnerung an die Funktion mean_squared_error(), die zur Berechnung des RMSE benötigt wird:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Aufgabe

Swipe to start coding

  1. Weisen Sie die DataFrame-Spalte 'age' von df der Variablen X zu.
  2. Verarbeiten Sie X mit der Klasse PolynomialFeatures vor.
  3. Teilen Sie den Datensatz mit der entsprechenden Funktion aus sklearn.
  4. Erstellen und trainieren Sie ein Modell mit dem Trainingsdatensatz.
  5. Sagen Sie die Zielwerte sowohl für den Trainings- als auch für den Testdatensatz voraus.
  6. Berechnen Sie das RMSE für Trainings- und Testdatensatz.
  7. Drucken Sie die Zusammenfassungstabelle aus.

Lösung

Nach Abschluss der Aufgabe fällt auf, dass der Test-RMSE sogar niedriger ist als der Trainings-RMSE. In der Regel erzielen Modelle auf unbekannten Instanzen keine besseren Ergebnisse. Hier ist der Unterschied jedoch sehr gering und zufallsbedingt. Unser Datensatz ist relativ klein, und beim Aufteilen hat das Testset etwas besser (leichter vorhersehbare) Datenpunkte erhalten.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 4
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain how to interpret RMSE values for training and test sets?

What does it mean if the test RMSE is lower than the training RMSE?

Can you provide an example of how to use train_test_split and mean_squared_error together?

close

Awesome!

Completion rate improved to 5.26

bookHerausforderung: Preisvorhersage mit Polynomregression

Swipe um das Menü anzuzeigen

In dieser Aufgabe wird dasselbe Polynomialregressionsmodell zweiten Grades wie in der vorherigen Aufgabe erstellt. Allerdings muss der Datensatz in ein Trainings- und ein Testset aufgeteilt werden, um den RMSE für beide Sets zu berechnen. Dies ist notwendig, um zu beurteilen, ob das Modell über- oder unteranpasst ist.
Hier eine Erinnerung an die Funktion train_test_split(), die verwendet werden soll.

Außerdem eine Erinnerung an die Funktion mean_squared_error(), die zur Berechnung des RMSE benötigt wird:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Aufgabe

Swipe to start coding

  1. Weisen Sie die DataFrame-Spalte 'age' von df der Variablen X zu.
  2. Verarbeiten Sie X mit der Klasse PolynomialFeatures vor.
  3. Teilen Sie den Datensatz mit der entsprechenden Funktion aus sklearn.
  4. Erstellen und trainieren Sie ein Modell mit dem Trainingsdatensatz.
  5. Sagen Sie die Zielwerte sowohl für den Trainings- als auch für den Testdatensatz voraus.
  6. Berechnen Sie das RMSE für Trainings- und Testdatensatz.
  7. Drucken Sie die Zusammenfassungstabelle aus.

Lösung

Nach Abschluss der Aufgabe fällt auf, dass der Test-RMSE sogar niedriger ist als der Trainings-RMSE. In der Regel erzielen Modelle auf unbekannten Instanzen keine besseren Ergebnisse. Hier ist der Unterschied jedoch sehr gering und zufallsbedingt. Unser Datensatz ist relativ klein, und beim Aufteilen hat das Testset etwas besser (leichter vorhersehbare) Datenpunkte erhalten.

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 4
single

single

some-alt