Uitdaging: Prijzen Voorspellen Met Behulp Van Twee Kenmerken
Voor deze uitdaging wordt dezelfde woningdataset gebruikt. Nu bevat deze echter twee kenmerken: de leeftijd en de oppervlakte van het huis (kolommen 'age'
en 'square_feet'
).
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houseprices.csv') print(df.head())
De opdracht is om een Multiple Linear Regression-model te bouwen met behulp van de OLS
-klasse. Daarnaast wordt gevraagd om de samenvattingstabel af te drukken om de p-waarden van elk kenmerk te bekijken.
Taak
Swipe to start coding
- Wijs de kolommen
'age'
en'square_feet'
vandf
toe aanX
. - Preprocess de
X
voor de constructor van deOLS
-klasse. - Bouw en train het model met behulp van de
OLS
-klasse. - Preprocess de array
X_new
op dezelfde manier alsX
. - Voorspel de target voor
X_new
. - Print de samenvattingstabel van het model.
Oplossing
Als alles correct is uitgevoerd, zijn de p-waarden dicht bij nul. Dit betekent dat al onze kenmerken significant zijn voor het model.
Was alles duidelijk?
Bedankt voor je feedback!