Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Asuntojen Hintojen Ennustaminen | Yksinkertainen Lineaarinen Regressio
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Lineaarinen Regressio Pythonilla

bookHaaste: Asuntojen Hintojen Ennustaminen

Seuraavaksi rakennetaan todellisen maailman esimerkkiregressiomalli. Käytössäsi on tiedosto, houses_simple.csv, joka sisältää tietoja asuntojen hinnoista sekä pinta-alasta ominaisuutena.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
copy

Seuraava vaihe on määrittää muuttujat ja visualisoida aineisto:

123456789
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
copy

Esimerkissä henkilön pituudesta oli paljon helpompi kuvitella viiva, joka sopii hyvin dataan.

Nyt kuitenkin datassamme on huomattavasti enemmän vaihtelua, koska kohdearvo riippuu monista muista tekijöistä, kuten iästä, sijainnista, sisustuksesta jne. Tehtävänä on kuitenkin rakentaa viiva, joka sopii parhaiten käytettävissä olevaan dataan; se näyttää trendin. Tätä varten tulisi käyttää OLS-luokkaa. Pian opimme, miten lisätä enemmän ominaisuuksia, mikä parantaa ennustetta!

Tehtävä

Swipe to start coding

  1. Aseta 'price'-datan df-sarake muuttujaan y.
  2. Luo X_tilde-matriisi käyttämällä add_constant()-funktiota kirjastosta statsmodels (tuotu nimellä sm).
  3. Alusta OLS-olio ja kouluta se.
  4. Esikäsittele X_new-taulukko samalla tavalla kuin X.
  5. Ennusta kohdearvo X_new_tilde-matriisille.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 5
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

bookHaaste: Asuntojen Hintojen Ennustaminen

Pyyhkäise näyttääksesi valikon

Seuraavaksi rakennetaan todellisen maailman esimerkkiregressiomalli. Käytössäsi on tiedosto, houses_simple.csv, joka sisältää tietoja asuntojen hinnoista sekä pinta-alasta ominaisuutena.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
copy

Seuraava vaihe on määrittää muuttujat ja visualisoida aineisto:

123456789
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
copy

Esimerkissä henkilön pituudesta oli paljon helpompi kuvitella viiva, joka sopii hyvin dataan.

Nyt kuitenkin datassamme on huomattavasti enemmän vaihtelua, koska kohdearvo riippuu monista muista tekijöistä, kuten iästä, sijainnista, sisustuksesta jne. Tehtävänä on kuitenkin rakentaa viiva, joka sopii parhaiten käytettävissä olevaan dataan; se näyttää trendin. Tätä varten tulisi käyttää OLS-luokkaa. Pian opimme, miten lisätä enemmän ominaisuuksia, mikä parantaa ennustetta!

Tehtävä

Swipe to start coding

  1. Aseta 'price'-datan df-sarake muuttujaan y.
  2. Luo X_tilde-matriisi käyttämällä add_constant()-funktiota kirjastosta statsmodels (tuotu nimellä sm).
  3. Alusta OLS-olio ja kouluta se.
  4. Esikäsittele X_new-taulukko samalla tavalla kuin X.
  5. Ennusta kohdearvo X_new_tilde-matriisille.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 5
single

single

some-alt