Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Prijsvoorspellingen Met Behulp van Polynomiale Regressie | Het Beste Model Kiezen
Lineaire Regressie Met Python

Veeg om het menu te tonen

book
Uitdaging: Prijsvoorspellingen Met Behulp van Polynomiale Regressie

Voor deze uitdaging bouw je dezelfde polynomiale regressie van graad 2 als in de vorige uitdaging. Je moet echter de dataset splitsen in een trainingsset en een testset om de RMSE voor beide sets te berekenen. Dit is nodig om te beoordelen of het model overfit of underfit.
Hier volgt een herinnering aan de train_test_split() functie die je wilt gebruiken.

En ook een herinnering aan de mean_squared_error() functie die nodig is om de RMSE te berekenen:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Taak

Swipe to start coding

  1. Wijs de DataFrame met één kolom 'age' van df toe aan de variabele X.
  2. Preprocess de X met behulp van de klasse PolynomialFeatures.
  3. Splits de dataset met de juiste functie uit sklearn.
  4. Bouw en train een model op de trainingsset.
  5. Voorspel de targets van zowel de trainings- als de testset.
  6. Bereken de RMSE voor zowel de trainings- als de testset.
  7. Print de samenvattingstabel.

Oplossing

Wanneer je de taak voltooit, zul je merken dat de test-RMSE zelfs lager is dan de trainings-RMSE. Gewoonlijk laten modellen geen betere resultaten zien op onbekende gegevens. Hier is het verschil klein en veroorzaakt door toeval. Onze dataset is relatief klein en bij het splitsen heeft de testset iets betere (makkelijker te voorspellen) datapunten gekregen.

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 4
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 5.26

book
Uitdaging: Prijsvoorspellingen Met Behulp van Polynomiale Regressie

Voor deze uitdaging bouw je dezelfde polynomiale regressie van graad 2 als in de vorige uitdaging. Je moet echter de dataset splitsen in een trainingsset en een testset om de RMSE voor beide sets te berekenen. Dit is nodig om te beoordelen of het model overfit of underfit.
Hier volgt een herinnering aan de train_test_split() functie die je wilt gebruiken.

En ook een herinnering aan de mean_squared_error() functie die nodig is om de RMSE te berekenen:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Taak

Swipe to start coding

  1. Wijs de DataFrame met één kolom 'age' van df toe aan de variabele X.
  2. Preprocess de X met behulp van de klasse PolynomialFeatures.
  3. Splits de dataset met de juiste functie uit sklearn.
  4. Bouw en train een model op de trainingsset.
  5. Voorspel de targets van zowel de trainings- als de testset.
  6. Bereken de RMSE voor zowel de trainings- als de testset.
  7. Print de samenvattingstabel.

Oplossing

Wanneer je de taak voltooit, zul je merken dat de test-RMSE zelfs lager is dan de trainings-RMSE. Gewoonlijk laten modellen geen betere resultaten zien op onbekende gegevens. Hier is het verschil klein en veroorzaakt door toeval. Onze dataset is relatief klein en bij het splitsen heeft de testset iets betere (makkelijker te voorspellen) datapunten gekregen.

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

close

Awesome!

Completion rate improved to 5.26

Veeg om het menu te tonen

some-alt