Udfordring: Forudsigelse af Huspriser
Du skal nu opbygge en regressionsmodel baseret på et virkeligt eksempel. Du har en fil, houses_simple.csv, som indeholder information om boligpriser med areal som en egenskab.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Næste trin er at tildele variabler og visualisere datasættet:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
I eksemplet med en persons højde var det meget nemmere at forestille sig en linje, der passer godt til dataene.
Men nu har vores data meget mere variation, da målet i høj grad afhænger af mange andre faktorer som alder, beliggenhed, interiør osv.
Opgaven er dog stadig at konstruere den linje, der bedst passer til de data, vi har; den vil vise tendensen. Klassen LinearRegression fra scikit-learn bør anvendes til dette formål.
Swipe to start coding
- Tildel kolonnen
'price'fradftily. - Opret variablen
X_reshapedved at omformeXtil et 2D-array med.values.reshape(-1, 1). - Initialiser
LinearRegression-modellen og træn den medX_reshapedogy. - Opret
X_new_reshapedved at omformeX_newpå samme måde. - Forudsig målet for
X_new_reshaped.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 3.33
Udfordring: Forudsigelse af Huspriser
Stryg for at vise menuen
Du skal nu opbygge en regressionsmodel baseret på et virkeligt eksempel. Du har en fil, houses_simple.csv, som indeholder information om boligpriser med areal som en egenskab.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Næste trin er at tildele variabler og visualisere datasættet:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
I eksemplet med en persons højde var det meget nemmere at forestille sig en linje, der passer godt til dataene.
Men nu har vores data meget mere variation, da målet i høj grad afhænger af mange andre faktorer som alder, beliggenhed, interiør osv.
Opgaven er dog stadig at konstruere den linje, der bedst passer til de data, vi har; den vil vise tendensen. Klassen LinearRegression fra scikit-learn bør anvendes til dette formål.
Swipe to start coding
- Tildel kolonnen
'price'fradftily. - Opret variablen
X_reshapedved at omformeXtil et 2D-array med.values.reshape(-1, 1). - Initialiser
LinearRegression-modellen og træn den medX_reshapedogy. - Opret
X_new_reshapedved at omformeX_newpå samme måde. - Forudsig målet for
X_new_reshaped.
Løsning
Tak for dine kommentarer!
single