Haaste: Hintojen Ennustaminen Polynomiregressiolla
Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa aineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta voidaan laskea RMSE molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Tässä muistutuksena train_test_split()-funktion käyttö.
Lisäksi muistutus mean_squared_error()-funktion ja np.sqrt()-funktion käytöstä RMSE:n laskemiseen:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Määritä muuttujaan
'age'DataFrame, jossa on vain yksi sarakedfX:stä. - Esikäsittele
XkäyttämälläPolynomialFeatures-luokkaa. - Jaa aineisto sopivalla
sklearn-funktiolla. - Rakenna ja kouluta malli harjoitusaineistolla.
- Ennusta sekä harjoitus- että testiaineiston kohdemuuttujat.
- Laske RMSE molemmille aineistoille.
- Tulosta yhteenvetotaulukko.
Ratkaisu
Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jakaessa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain how to use the train_test_split function in this context?
What is the formula for calculating RMSE, and why is it important?
How can I interpret the difference between training and test RMSE values?
Awesome!
Completion rate improved to 5.26
Haaste: Hintojen Ennustaminen Polynomiregressiolla
Pyyhkäise näyttääksesi valikon
Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa aineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta voidaan laskea RMSE molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Tässä muistutuksena train_test_split()-funktion käyttö.
Lisäksi muistutus mean_squared_error()-funktion ja np.sqrt()-funktion käytöstä RMSE:n laskemiseen:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Swipe to start coding
- Määritä muuttujaan
'age'DataFrame, jossa on vain yksi sarakedfX:stä. - Esikäsittele
XkäyttämälläPolynomialFeatures-luokkaa. - Jaa aineisto sopivalla
sklearn-funktiolla. - Rakenna ja kouluta malli harjoitusaineistolla.
- Ennusta sekä harjoitus- että testiaineiston kohdemuuttujat.
- Laske RMSE molemmille aineistoille.
- Tulosta yhteenvetotaulukko.
Ratkaisu
Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jakaessa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.
Kiitos palautteestasi!
single