Udfordring: Forudsigelse af Huspriser
Du skal nu opbygge en regressionsmodel baseret på et virkeligt eksempel. Du har en fil, houses_simple.csv, som indeholder information om boligpriser med areal som en egenskab.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Næste trin er at tildele variabler og visualisere datasættet:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
I eksemplet med en persons højde var det meget lettere at forestille sig en linje, der passer godt til dataene.
Men nu har vores data meget mere variation, da målet i høj grad afhænger af mange andre faktorer som alder, beliggenhed, interiør osv.
Opgaven er dog stadig at konstruere den linje, der bedst passer til de data, vi har; den vil vise tendensen. Klassen OLS skal bruges til dette. Snart lærer vi, hvordan vi kan tilføje flere funktioner, hvilket vil forbedre forudsigelsen!
Swipe to start coding
- Tildel kolonnen
'price'fradftily. - Opret matricen
X_tildeved hjælp af funktionenadd_constant()frastatsmodels(importeret somsm). - Initialiser
OLS-objektet og træn det. - Forbehandl arrayet
X_newpå samme måde somX. - Forudsig målet for matricen
X_new_tilde.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 5.26
Udfordring: Forudsigelse af Huspriser
Stryg for at vise menuen
Du skal nu opbygge en regressionsmodel baseret på et virkeligt eksempel. Du har en fil, houses_simple.csv, som indeholder information om boligpriser med areal som en egenskab.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Næste trin er at tildele variabler og visualisere datasættet:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
I eksemplet med en persons højde var det meget lettere at forestille sig en linje, der passer godt til dataene.
Men nu har vores data meget mere variation, da målet i høj grad afhænger af mange andre faktorer som alder, beliggenhed, interiør osv.
Opgaven er dog stadig at konstruere den linje, der bedst passer til de data, vi har; den vil vise tendensen. Klassen OLS skal bruges til dette. Snart lærer vi, hvordan vi kan tilføje flere funktioner, hvilket vil forbedre forudsigelsen!
Swipe to start coding
- Tildel kolonnen
'price'fradftily. - Opret matricen
X_tildeved hjælp af funktionenadd_constant()frastatsmodels(importeret somsm). - Initialiser
OLS-objektet og træn det. - Forbehandl arrayet
X_newpå samme måde somX. - Forudsig målet for matricen
X_new_tilde.
Løsning
Tak for dine kommentarer!
single