Udfordring: Forudsigelse af Priser ved Brug af To Funktioner
Til denne udfordring anvendes det samme boligdatasæt. Nu har det dog to funktioner: husets alder og areal (kolonnerne 'age'
og 'square_feet'
).
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houseprices.csv') print(df.head())
Opgaven er at opbygge en multipel lineær regressionsmodel ved hjælp af OLS
-klassen. Derudover skal du udskrive oversigtstabellen for at se p-værdierne for hver funktion.
Opgave
Swipe to start coding
- Tildel kolonnerne
'age'
og'square_feet'
fradf
tilX
. - Forbehandl
X
til brug iOLS
-klassens konstruktør. - Byg og træn modellen ved hjælp af
OLS
-klassen. - Forbehandl arrayet
X_new
på samme måde somX
. - Forudsig målet for
X_new
. - Udskriv modellens oversigtstabel.
Løsning
Hvis du har gjort alt korrekt, har du fået p-værdier tæt på nul. Det betyder, at alle vores funktioner er signifikante for modellen.
Var alt klart?
Tak for dine kommentarer!