Desafío: Predicción de Precios de Viviendas
Ahora construirá un modelo de regresión aplicado a un ejemplo del mundo real. Tiene un archivo, houses_simple.csv, que contiene información sobre los precios de viviendas con el área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más sencillo imaginar una línea que se ajustara bien a los datos.
Sin embargo, ahora nuestros datos presentan mucha más variabilidad, ya que el objetivo depende en gran medida de otros factores como la antigüedad, ubicación, interior, etc.
De todas formas, la tarea consiste en construir la línea que mejor se ajuste a los datos disponibles; esto mostrará la tendencia. Se debe utilizar la clase LinearRegression de scikit-learn para ello.
Swipe to start coding
- Asignar la columna
'price'dedfay. - Crear la variable
X_reshapedreestructurandoXen un arreglo 2D usando.values.reshape(-1, 1). - Inicializar el modelo
LinearRegressiony entrenarlo usandoX_reshapedyy. - Crear
X_new_reshapedreestructurandoX_newde la misma manera. - Predecir el objetivo para
X_new_reshaped.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Genial!
Completion tasa mejorada a 3.33
Desafío: Predicción de Precios de Viviendas
Desliza para mostrar el menú
Ahora construirá un modelo de regresión aplicado a un ejemplo del mundo real. Tiene un archivo, houses_simple.csv, que contiene información sobre los precios de viviendas con el área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más sencillo imaginar una línea que se ajustara bien a los datos.
Sin embargo, ahora nuestros datos presentan mucha más variabilidad, ya que el objetivo depende en gran medida de otros factores como la antigüedad, ubicación, interior, etc.
De todas formas, la tarea consiste en construir la línea que mejor se ajuste a los datos disponibles; esto mostrará la tendencia. Se debe utilizar la clase LinearRegression de scikit-learn para ello.
Swipe to start coding
- Asignar la columna
'price'dedfay. - Crear la variable
X_reshapedreestructurandoXen un arreglo 2D usando.values.reshape(-1, 1). - Inicializar el modelo
LinearRegressiony entrenarlo usandoX_reshapedyy. - Crear
X_new_reshapedreestructurandoX_newde la misma manera. - Predecir el objetivo para
X_new_reshaped.
Solución
¡Gracias por tus comentarios!
single