Uitdaging: Prijsvoorspellingen Met Behulp Van Polynomiale Regressie
Voor deze uitdaging bouw je dezelfde Polynomial Regression van graad 2 als in de vorige uitdaging. Je moet echter de dataset splitsen in een trainingset en een testset om de RMSE voor beide sets te berekenen. Dit is nodig om te beoordelen of het model overfit of underfit.
Hier volgt een herinnering aan de train_test_split() functie die je wilt gebruiken.
En ook een herinnering aan de mean_squared_error() functie met np.sqrt() die nodig is om de RMSE te berekenen:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Wijs de DataFrame met één kolom
'age'vandftoe aan de variabeleX. - Verwerk
Xmet behulp van de klassePolynomialFeatures. - Splits de dataset met de juiste functie uit
sklearn. - Bouw en train een model op de trainingsset.
- Voorspel de doelwaarden van zowel de trainings- als de testset.
- Bereken de RMSE voor zowel de trainings- als de testset.
- Print de samenvattingstabel.
Oplossing
Wanneer je de taak voltooit, zul je merken dat de test-RMSE zelfs lager is dan de trainings-RMSE. Gewoonlijk laten modellen geen betere resultaten zien op onbekende voorbeelden. Hier is het verschil klein en veroorzaakt door toeval. Onze dataset is relatief klein en bij het splitsen heeft de testset iets betere (makkelijker te voorspellen) datapunten gekregen.
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Can you explain how to use the train_test_split function in this context?
What is the formula for calculating RMSE, and why is it important?
How can I interpret the difference between training and test RMSE values?
Awesome!
Completion rate improved to 5.26
Uitdaging: Prijsvoorspellingen Met Behulp Van Polynomiale Regressie
Veeg om het menu te tonen
Voor deze uitdaging bouw je dezelfde Polynomial Regression van graad 2 als in de vorige uitdaging. Je moet echter de dataset splitsen in een trainingset en een testset om de RMSE voor beide sets te berekenen. Dit is nodig om te beoordelen of het model overfit of underfit.
Hier volgt een herinnering aan de train_test_split() functie die je wilt gebruiken.
En ook een herinnering aan de mean_squared_error() functie met np.sqrt() die nodig is om de RMSE te berekenen:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Wijs de DataFrame met één kolom
'age'vandftoe aan de variabeleX. - Verwerk
Xmet behulp van de klassePolynomialFeatures. - Splits de dataset met de juiste functie uit
sklearn. - Bouw en train een model op de trainingsset.
- Voorspel de doelwaarden van zowel de trainings- als de testset.
- Bereken de RMSE voor zowel de trainings- als de testset.
- Print de samenvattingstabel.
Oplossing
Wanneer je de taak voltooit, zul je merken dat de test-RMSE zelfs lager is dan de trainings-RMSE. Gewoonlijk laten modellen geen betere resultaten zien op onbekende voorbeelden. Hier is het verschil klein en veroorzaakt door toeval. Onze dataset is relatief klein en bij het splitsen heeft de testset iets betere (makkelijker te voorspellen) datapunten gekregen.
Bedankt voor je feedback!
single