Utmaning: Förutsäga Priser Med Två Variabler
För denna utmaning används samma bostadsdataset. Nu har det dock två variabler: husets ålder och yta (kolumnerna 'age'
och 'square_feet'
).
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houseprices.csv') print(df.head())
Uppgiften är att bygga en multipel linjär regressionsmodell med hjälp av klassen OLS
. Du ska även skriva ut sammanfattningstabellen för att granska p-värdena för varje variabel.
Swipe to start coding
- Tilldela kolumnerna
'age'
och'square_feet'
fråndf
tillX
. - Förbehandla
X
förOLS
-klassens konstruktor. - Bygg och träna modellen med hjälp av
OLS
-klassen. - Förbehandla arrayen
X_new
på samma sätt somX
. - Förutsäg målet för
X_new
. - Skriv ut modellens sammanfattningstabell.
Lösning
Om du gjorde allt korrekt fick du p-värden nära noll. Det innebär att alla våra variabler är signifikanta för modellen.
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 5.26
Utmaning: Förutsäga Priser Med Två Variabler
Svep för att visa menyn
För denna utmaning används samma bostadsdataset. Nu har det dock två variabler: husets ålder och yta (kolumnerna 'age'
och 'square_feet'
).
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houseprices.csv') print(df.head())
Uppgiften är att bygga en multipel linjär regressionsmodell med hjälp av klassen OLS
. Du ska även skriva ut sammanfattningstabellen för att granska p-värdena för varje variabel.
Swipe to start coding
- Tilldela kolumnerna
'age'
och'square_feet'
fråndf
tillX
. - Förbehandla
X
förOLS
-klassens konstruktor. - Bygg och träna modellen med hjälp av
OLS
-klassen. - Förbehandla arrayen
X_new
på samma sätt somX
. - Förutsäg målet för
X_new
. - Skriv ut modellens sammanfattningstabell.
Lösning
Om du gjorde allt korrekt fick du p-värden nära noll. Det innebär att alla våra variabler är signifikanta för modellen.
Tack för dina kommentarer!
Awesome!
Completion rate improved to 5.26single