Uitdaging: Het Voorspellen van Huizenprijzen
Je gaat nu een regressiemodel bouwen met een praktijkvoorbeeld. Je hebt een bestand, houses_simple.csv, dat informatie bevat over huizenprijzen met de oppervlakte als kenmerk.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
De volgende stap is het toewijzen van variabelen en het visualiseren van de dataset:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
In het voorbeeld met de lengte van een persoon was het veel eenvoudiger om je een lijn voor te stellen die goed bij de gegevens past.
Maar nu vertonen onze gegevens veel meer variatie, omdat de doelvariabele sterk afhankelijk is van andere factoren zoals leeftijd, locatie, interieur, enzovoort.
Desondanks is de opdracht om de lijn te construeren die het beste bij de beschikbare gegevens past; deze zal de trend weergeven. De LinearRegression-klasse uit scikit-learn dient hiervoor te worden gebruikt.
Swipe to start coding
- Wijs de kolom
'price'vandftoe aany. - Maak de variabele
X_reshapeddoorXom te vormen tot een 2D-array met.values.reshape(-1, 1). - Initialiseer het
LinearRegression-model en train dit metX_reshapedeny. - Maak
X_new_reshapeddoorX_newop dezelfde manier te reshapen. - Voorspel de target voor
X_new_reshaped.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 3.33
Uitdaging: Het Voorspellen van Huizenprijzen
Veeg om het menu te tonen
Je gaat nu een regressiemodel bouwen met een praktijkvoorbeeld. Je hebt een bestand, houses_simple.csv, dat informatie bevat over huizenprijzen met de oppervlakte als kenmerk.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
De volgende stap is het toewijzen van variabelen en het visualiseren van de dataset:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
In het voorbeeld met de lengte van een persoon was het veel eenvoudiger om je een lijn voor te stellen die goed bij de gegevens past.
Maar nu vertonen onze gegevens veel meer variatie, omdat de doelvariabele sterk afhankelijk is van andere factoren zoals leeftijd, locatie, interieur, enzovoort.
Desondanks is de opdracht om de lijn te construeren die het beste bij de beschikbare gegevens past; deze zal de trend weergeven. De LinearRegression-klasse uit scikit-learn dient hiervoor te worden gebruikt.
Swipe to start coding
- Wijs de kolom
'price'vandftoe aany. - Maak de variabele
X_reshapeddoorXom te vormen tot een 2D-array met.values.reshape(-1, 1). - Initialiseer het
LinearRegression-model en train dit metX_reshapedeny. - Maak
X_new_reshapeddoorX_newop dezelfde manier te reshapen. - Voorspel de target voor
X_new_reshaped.
Oplossing
Bedankt voor je feedback!
single