Haaste: Asuntojen Hintojen Ennustaminen
Seuraavaksi rakennat käytännön esimerkin regressiomallista. Sinulla on tiedosto, houses_simple.csv, joka sisältää tietoja asuntojen hinnoista sekä pinta-alasta ominaisuutena.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Seuraava vaihe on muuttujien määrittäminen ja aineiston visualisointi:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Esimerkissä henkilön pituudesta oli huomattavasti helpompi kuvitella viiva, joka sopii hyvin aineistoon.
Nyt kuitenkin aineistossamme on paljon enemmän vaihtelua, koska kohde muuttujaan vaikuttavat monet muut tekijät, kuten ikä, sijainti, sisustus jne.
Tehtävänä on kuitenkin rakentaa viiva, joka sopii parhaiten käytettävissä olevaan aineistoon; se näyttää trendin. Tätä varten tulisi käyttää LinearRegression-luokkaa kirjastosta scikit-learn.
Swipe to start coding
- Määritä
'price':ksidf-datany-sarake. - Luo
X_reshapedmuotoilemallaXkaksiulotteiseksi taulukoksi käyttämällä.values.reshape(-1, 1). - Alusta
LinearRegression-malli ja kouluta se käyttäenX_reshapedjay. - Luo
X_new_reshapedmuotoilemallaX_newsamalla tavalla. - Ennusta kohdearvo
X_new_reshaped:lle.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 3.33
Haaste: Asuntojen Hintojen Ennustaminen
Pyyhkäise näyttääksesi valikon
Seuraavaksi rakennat käytännön esimerkin regressiomallista. Sinulla on tiedosto, houses_simple.csv, joka sisältää tietoja asuntojen hinnoista sekä pinta-alasta ominaisuutena.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Seuraava vaihe on muuttujien määrittäminen ja aineiston visualisointi:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
Esimerkissä henkilön pituudesta oli huomattavasti helpompi kuvitella viiva, joka sopii hyvin aineistoon.
Nyt kuitenkin aineistossamme on paljon enemmän vaihtelua, koska kohde muuttujaan vaikuttavat monet muut tekijät, kuten ikä, sijainti, sisustus jne.
Tehtävänä on kuitenkin rakentaa viiva, joka sopii parhaiten käytettävissä olevaan aineistoon; se näyttää trendin. Tätä varten tulisi käyttää LinearRegression-luokkaa kirjastosta scikit-learn.
Swipe to start coding
- Määritä
'price':ksidf-datany-sarake. - Luo
X_reshapedmuotoilemallaXkaksiulotteiseksi taulukoksi käyttämällä.values.reshape(-1, 1). - Alusta
LinearRegression-malli ja kouluta se käyttäenX_reshapedjay. - Luo
X_new_reshapedmuotoilemallaX_newsamalla tavalla. - Ennusta kohdearvo
X_new_reshaped:lle.
Ratkaisu
Kiitos palautteestasi!
single