Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Hintojen Ennustaminen Polynomiregressiolla | Parhaan Mallin Valitseminen
Lineaarinen Regressio Pythonilla

bookHaaste: Hintojen Ennustaminen Polynomiregressiolla

Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa tietoaineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta RMSE voidaan laskea molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Alla muistutus train_test_split()-funktiosta, jota kannattaa käyttää.

Sekä muistutus mean_squared_error()-funktiosta, jolla RMSE lasketaan:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Tehtävä

Swipe to start coding

  1. Määritä muuttujaan 'age' DataFrame, jossa on vain yksi sarake df X-stä.
  2. Esikäsittele X käyttämällä PolynomialFeatures-luokkaa.
  3. Jaa aineisto sopivalla sklearn-funktiolla.
  4. Rakenna ja kouluta malli harjoitusaineistolla.
  5. Ennusta sekä harjoitus- että testiaineiston kohteet.
  6. Laske RMSE sekä harjoitus- että testiaineistolle.
  7. Tulosta yhteenvetotaulukko.

Ratkaisu

Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät tuota parempia tuloksia näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jaossa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 4
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain how to interpret RMSE values for training and test sets?

What does it mean if the test RMSE is lower than the training RMSE?

Can you provide an example of how to use train_test_split and mean_squared_error together?

close

Awesome!

Completion rate improved to 5.26

bookHaaste: Hintojen Ennustaminen Polynomiregressiolla

Pyyhkäise näyttääksesi valikon

Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa tietoaineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta RMSE voidaan laskea molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Alla muistutus train_test_split()-funktiosta, jota kannattaa käyttää.

Sekä muistutus mean_squared_error()-funktiosta, jolla RMSE lasketaan:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Tehtävä

Swipe to start coding

  1. Määritä muuttujaan 'age' DataFrame, jossa on vain yksi sarake df X-stä.
  2. Esikäsittele X käyttämällä PolynomialFeatures-luokkaa.
  3. Jaa aineisto sopivalla sklearn-funktiolla.
  4. Rakenna ja kouluta malli harjoitusaineistolla.
  5. Ennusta sekä harjoitus- että testiaineiston kohteet.
  6. Laske RMSE sekä harjoitus- että testiaineistolle.
  7. Tulosta yhteenvetotaulukko.

Ratkaisu

Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät tuota parempia tuloksia näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jaossa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 4
single

single

some-alt