Haaste: Mallin Arviointi
Tässä haasteessa käytössäsi on vanha tuttu asuntodata, mutta tällä kertaa vain 'age'
-ominaisuudella.
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_poly.csv') print(df.head())
Seuraavaksi luodaan hajontakuvio tälle datalle:
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_poly.csv') X = df['age'] y = df['price'] plt.scatter(X, y, alpha=0.4) plt.show()
Suoran viivan sovittaminen näihin tietoihin ei välttämättä ole paras valinta. Hinta nousee sekä täysin uusissa että hyvin vanhoissa taloissa. Paraabelin sovittaminen vaikuttaa paremmalta vaihtoehdolta. Tämä onkin tämän haasteen tehtävä.
Mutta ennen kuin aloitat, kertaa PolynomialFeatures
-luokka.
Metodi fit_transform(X)
vaatii, että X
on 2-ulotteinen taulukko (tai DataFrame).
Käyttämällä X = df[['column_name']]
saat X
:n sopivaksi fit_transform()
-metodille.
Jos sinulla on 1-ulotteinen taulukko, käytä .reshape(-1, 1)
muuntaaksesi sen 2-ulotteiseksi taulukoksi, jossa on samat tiedot.
Tavoitteena on rakentaa toisen asteen polynomiregressiomalli käyttäen PolynomialFeatures
- ja OLS
-menetelmiä.
Swipe to start coding
- Määritä
X
-muuttuja DataFrameen, joka sisältää sarakkeen'age'
. - Luo
X_tilde
-matriisi käyttämälläPolynomialFeatures
-luokkaa. - Rakenna ja kouluta polynomiregressiomalli.
- Muotoile
X_new
kaksiulotteiseksi taulukoksi. - Esikäsittele
X_new
samalla tavalla kuinX
. - Tulosta mallin parametrit.
Ratkaisu
Kiitos palautteestasi!