Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Hintojen Ennustaminen Polynomiregressiolla | Parhaan Mallin Valitseminen
Lineaarinen Regressio Pythonilla

Pyyhkäise näyttääksesi valikon

book
Haaste: Hintojen Ennustaminen Polynomiregressiolla

Tässä haasteessa rakennat saman toisen asteen polynomiregression kuin edellisessä haasteessa. Sinun tulee kuitenkin jakaa aineisto opetus- ja testijoukkoon, jotta voit laskea RMSE-arvon molemmille joukoille. Tämä on tarpeen, jotta voidaan arvioida, ylikö tai aliko malli.
Tässä muistutuksena train_test_split()-funktion käyttö.

Sekä muistutus mean_squared_error()-funktiosta, jota tarvitaan RMSE:n laskemiseen:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Tehtävä

Swipe to start coding

  1. Määritä DataFrame, jossa on vain yksi sarake 'age' muuttujasta df, muuttujaan X.
  2. Esikäsittele X käyttämällä PolynomialFeatures-luokkaa.
  3. Jaa aineisto sopivalla sklearn-funktiolla.
  4. Rakenna ja kouluta malli harjoitusaineistolla.
  5. Ennusta sekä harjoitus- että testiaineiston kohdearvot.
  6. Laske RMSE molemmille aineistoille.
  7. Tulosta yhteenvetotaulukko.

Ratkaisu

Kun olet suorittanut tehtävän, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä esimerkeillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jaossa testijoukkoon päätyi hieman helpompia (helpommin ennustettavia) havaintoja.

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 4
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 5.26

book
Haaste: Hintojen Ennustaminen Polynomiregressiolla

Tässä haasteessa rakennat saman toisen asteen polynomiregression kuin edellisessä haasteessa. Sinun tulee kuitenkin jakaa aineisto opetus- ja testijoukkoon, jotta voit laskea RMSE-arvon molemmille joukoille. Tämä on tarpeen, jotta voidaan arvioida, ylikö tai aliko malli.
Tässä muistutuksena train_test_split()-funktion käyttö.

Sekä muistutus mean_squared_error()-funktiosta, jota tarvitaan RMSE:n laskemiseen:

rmse = mean_squared_error(y_true, y_predicted, squared=False)
Tehtävä

Swipe to start coding

  1. Määritä DataFrame, jossa on vain yksi sarake 'age' muuttujasta df, muuttujaan X.
  2. Esikäsittele X käyttämällä PolynomialFeatures-luokkaa.
  3. Jaa aineisto sopivalla sklearn-funktiolla.
  4. Rakenna ja kouluta malli harjoitusaineistolla.
  5. Ennusta sekä harjoitus- että testiaineiston kohdearvot.
  6. Laske RMSE molemmille aineistoille.
  7. Tulosta yhteenvetotaulukko.

Ratkaisu

Kun olet suorittanut tehtävän, huomaat, että testijoukon RMSE on jopa pienempi kuin opetusjoukon RMSE. Yleensä mallit eivät suoriudu paremmin näkemättömillä esimerkeillä. Tässä ero on kuitenkin hyvin pieni ja johtuu sattumasta. Aineistomme on melko pieni, ja jaossa testijoukkoon päätyi hieman helpompia (helpommin ennustettavia) havaintoja.

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

close

Awesome!

Completion rate improved to 5.26

Pyyhkäise näyttääksesi valikon

some-alt