Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Hintojen Ennustaminen Polynomiregressiolla | Parhaan Mallin Valitseminen
Lineaarinen Regressio Pythonilla

bookHaaste: Hintojen Ennustaminen Polynomiregressiolla

Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa aineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta voidaan laskea RMSE molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Tässä muistutuksena train_test_split()-funktion käyttö.

Lisäksi muistutus mean_squared_error()-funktion ja np.sqrt()-funktion käytöstä RMSE:n laskemiseen:

rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Tehtävä

Swipe to start coding

  1. Määritä muuttujaan 'age' DataFrame, jossa on vain yksi sarake df X:stä.
  2. Esikäsittele X käyttämällä PolynomialFeatures-luokkaa.
  3. Jaa aineisto sopivalla sklearn-funktiolla.
  4. Rakenna ja kouluta malli harjoitusaineistolla.
  5. Ennusta sekä harjoitus- että testiaineiston kohdemuuttujat.
  6. Laske RMSE molemmille aineistoille.
  7. Tulosta yhteenvetotaulukko.

Ratkaisu

Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jakaessa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 4
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain how to use the train_test_split function in this context?

What is the formula for calculating RMSE, and why is it important?

How can I interpret the difference between training and test RMSE values?

close

Awesome!

Completion rate improved to 5.26

bookHaaste: Hintojen Ennustaminen Polynomiregressiolla

Pyyhkäise näyttääksesi valikon

Tässä haasteessa rakennetaan sama toisen asteen polynomiregressiomalli kuin edellisessä haasteessa. Tällä kertaa aineisto tulee kuitenkin jakaa opetus- ja testijoukkoon, jotta voidaan laskea RMSE molemmille joukoille. Tämä on tarpeen mallin yli- tai alisovittamisen arvioimiseksi.
Tässä muistutuksena train_test_split()-funktion käyttö.

Lisäksi muistutus mean_squared_error()-funktion ja np.sqrt()-funktion käytöstä RMSE:n laskemiseen:

rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
Tehtävä

Swipe to start coding

  1. Määritä muuttujaan 'age' DataFrame, jossa on vain yksi sarake df X:stä.
  2. Esikäsittele X käyttämällä PolynomialFeatures-luokkaa.
  3. Jaa aineisto sopivalla sklearn-funktiolla.
  4. Rakenna ja kouluta malli harjoitusaineistolla.
  5. Ennusta sekä harjoitus- että testiaineiston kohdemuuttujat.
  6. Laske RMSE molemmille aineistoille.
  7. Tulosta yhteenvetotaulukko.

Ratkaisu

Kun tehtävä on suoritettu, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä havaintopisteillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jakaessa testijoukkoon päätyi hieman helpommin ennustettavia havaintoja.

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 4
single

single

some-alt