Udfordring: Forudsigelse af Huspriser
Du skal nu opbygge en regressionsmodel baseret på et virkeligt eksempel. Du har en fil, houses_simple.csv
, som indeholder information om boligpriser med areal som en egenskab.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Næste trin er at tildele variabler og visualisere datasættet:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
I eksemplet med en persons højde var det meget lettere at forestille sig en linje, der passede godt til dataene.
Men nu har vores data meget større variation, da målet i høj grad afhænger af mange andre faktorer som alder, beliggenhed, indretning osv.
Opgaven er dog stadig at konstruere den linje, der bedst passer til de data, vi har; den vil vise tendensen. Klassen OLS
skal anvendes til dette formål. Snart lærer vi, hvordan vi kan tilføje flere egenskaber, hvilket vil forbedre forudsigelsen!
Swipe to start coding
- Tildel kolonnen
'price'
fradf
tily
. - Opret
X_tilde
-matricen ved hjælp af funktionenadd_constant()
frastatsmodels
(importeret somsm
). - Initialiser
OLS
-objektet og træn det. - Forbehandl
X_new
-arrayet på samme måde somX
. - Forudsig målet for
X_new_tilde
-matricen.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 5.26
Udfordring: Forudsigelse af Huspriser
Stryg for at vise menuen
Du skal nu opbygge en regressionsmodel baseret på et virkeligt eksempel. Du har en fil, houses_simple.csv
, som indeholder information om boligpriser med areal som en egenskab.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Næste trin er at tildele variabler og visualisere datasættet:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
I eksemplet med en persons højde var det meget lettere at forestille sig en linje, der passede godt til dataene.
Men nu har vores data meget større variation, da målet i høj grad afhænger af mange andre faktorer som alder, beliggenhed, indretning osv.
Opgaven er dog stadig at konstruere den linje, der bedst passer til de data, vi har; den vil vise tendensen. Klassen OLS
skal anvendes til dette formål. Snart lærer vi, hvordan vi kan tilføje flere egenskaber, hvilket vil forbedre forudsigelsen!
Swipe to start coding
- Tildel kolonnen
'price'
fradf
tily
. - Opret
X_tilde
-matricen ved hjælp af funktionenadd_constant()
frastatsmodels
(importeret somsm
). - Initialiser
OLS
-objektet og træn det. - Forbehandl
X_new
-arrayet på samme måde somX
. - Forudsig målet for
X_new_tilde
-matricen.
Løsning
Tak for dine kommentarer!
single