Uitdaging: Prijsvoorspellingen Met Behulp Van Polynomiale Regressie
Voor deze uitdaging wordt dezelfde polynomiale regressie van graad 2 gebouwd als in de vorige oefening. Echter, het is noodzakelijk om de dataset te splitsen in een trainingsset en een testset om de RMSE voor beide sets te berekenen. Dit is vereist om te beoordelen of het model overfit of underfit vertoont.
Hier volgt een herinnering aan de train_test_split()
functie die gebruikt dient te worden.
En tevens een herinnering aan de mean_squared_error()
functie die nodig is om de RMSE te berekenen:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Wijs de DataFrame met één kolom
'age'
vandf
toe aan de variabeleX
. - Verwerk
X
voor met behulp van de klassePolynomialFeatures
. - Splits de dataset met de juiste functie uit
sklearn
. - Bouw en train een model op de trainingsset.
- Voorspel de targets van zowel de trainings- als de testset.
- Bereken de RMSE voor zowel de trainings- als de testset.
- Print de samenvattingstabel.
Oplossing
Na het voltooien van de taak zal opvallen dat de test-RMSE zelfs lager is dan de trainings-RMSE. Gewoonlijk leveren modellen geen betere resultaten op voor onbekende gevallen. In dit geval is het verschil minimaal en toe te schrijven aan toeval. De dataset is relatief klein en bij het splitsen heeft de testset iets betere (makkelijker te voorspellen) datapunten ontvangen.
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 5.26
Uitdaging: Prijsvoorspellingen Met Behulp Van Polynomiale Regressie
Veeg om het menu te tonen
Voor deze uitdaging wordt dezelfde polynomiale regressie van graad 2 gebouwd als in de vorige oefening. Echter, het is noodzakelijk om de dataset te splitsen in een trainingsset en een testset om de RMSE voor beide sets te berekenen. Dit is vereist om te beoordelen of het model overfit of underfit vertoont.
Hier volgt een herinnering aan de train_test_split()
functie die gebruikt dient te worden.
En tevens een herinnering aan de mean_squared_error()
functie die nodig is om de RMSE te berekenen:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Wijs de DataFrame met één kolom
'age'
vandf
toe aan de variabeleX
. - Verwerk
X
voor met behulp van de klassePolynomialFeatures
. - Splits de dataset met de juiste functie uit
sklearn
. - Bouw en train een model op de trainingsset.
- Voorspel de targets van zowel de trainings- als de testset.
- Bereken de RMSE voor zowel de trainings- als de testset.
- Print de samenvattingstabel.
Oplossing
Na het voltooien van de taak zal opvallen dat de test-RMSE zelfs lager is dan de trainings-RMSE. Gewoonlijk leveren modellen geen betere resultaten op voor onbekende gevallen. In dit geval is het verschil minimaal en toe te schrijven aan toeval. De dataset is relatief klein en bij het splitsen heeft de testset iets betere (makkelijker te voorspellen) datapunten ontvangen.
Bedankt voor je feedback!
single