Haaste: Hintojen Ennustaminen Polynomiregressiolla
Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa tietoaineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta RMSE voidaan laskea molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Alla muistutus train_test_split()
-funktiosta, jota kannattaa käyttää.
Sekä muistutus mean_squared_error()
-funktiosta, jolla RMSE lasketaan:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Määritä muuttujaan
'age'
DataFrame, jossa on vain yksi sarakedf
X
-stä. - Esikäsittele
X
käyttämälläPolynomialFeatures
-luokkaa. - Jaa aineisto sopivalla
sklearn
-funktiolla. - Rakenna ja kouluta malli harjoitusaineistolla.
- Ennusta sekä harjoitus- että testiaineiston kohteet.
- Laske RMSE sekä harjoitus- että testiaineistolle.
- Tulosta yhteenvetotaulukko.
Ratkaisu
Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät tuota parempia tuloksia näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jaossa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain how to interpret RMSE values for training and test sets?
What does it mean if the test RMSE is lower than the training RMSE?
Can you provide an example of how to use train_test_split and mean_squared_error together?
Awesome!
Completion rate improved to 5.26
Haaste: Hintojen Ennustaminen Polynomiregressiolla
Pyyhkäise näyttääksesi valikon
Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa tietoaineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta RMSE voidaan laskea molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Alla muistutus train_test_split()
-funktiosta, jota kannattaa käyttää.
Sekä muistutus mean_squared_error()
-funktiosta, jolla RMSE lasketaan:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Määritä muuttujaan
'age'
DataFrame, jossa on vain yksi sarakedf
X
-stä. - Esikäsittele
X
käyttämälläPolynomialFeatures
-luokkaa. - Jaa aineisto sopivalla
sklearn
-funktiolla. - Rakenna ja kouluta malli harjoitusaineistolla.
- Ennusta sekä harjoitus- että testiaineiston kohteet.
- Laske RMSE sekä harjoitus- että testiaineistolle.
- Tulosta yhteenvetotaulukko.
Ratkaisu
Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät tuota parempia tuloksia näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jaossa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.
Kiitos palautteestasi!
single