Desafío: Predicción de Precios de Viviendas
Ahora construirás un modelo de regresión con un ejemplo del mundo real. Tienes un archivo, houses_simple.csv
, que contiene información sobre los precios de viviendas con su área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más sencillo imaginar una línea que se ajustara bien a los datos.
Sin embargo, ahora nuestros datos presentan mucha más variabilidad, ya que el objetivo depende en gran medida de otros factores como la antigüedad, ubicación, interior, etc.
De todas formas, la tarea consiste en construir la línea que mejor se ajuste a los datos disponibles; esta mostrará la tendencia. Para ello, se debe utilizar la clase OLS
. Pronto aprenderemos cómo añadir más características, lo que mejorará la predicción.
Swipe to start coding
- Asignar la columna
'price'
dedf
ay
. - Crear la matriz
X_tilde
utilizando la funciónadd_constant()
destatsmodels
(importada comosm
). - Inicializar el objeto
OLS
y entrenarlo. - Preprocesar el arreglo
X_new
de la misma manera queX
. - Predecir el objetivo para la matriz
X_new_tilde
.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 5.26Awesome!
Completion rate improved to 5.26
Desafío: Predicción de Precios de Viviendas
Ahora construirás un modelo de regresión con un ejemplo del mundo real. Tienes un archivo, houses_simple.csv
, que contiene información sobre los precios de viviendas con su área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más sencillo imaginar una línea que se ajustara bien a los datos.
Sin embargo, ahora nuestros datos presentan mucha más variabilidad, ya que el objetivo depende en gran medida de otros factores como la antigüedad, ubicación, interior, etc.
De todas formas, la tarea consiste en construir la línea que mejor se ajuste a los datos disponibles; esta mostrará la tendencia. Para ello, se debe utilizar la clase OLS
. Pronto aprenderemos cómo añadir más características, lo que mejorará la predicción.
Swipe to start coding
- Asignar la columna
'price'
dedf
ay
. - Crear la matriz
X_tilde
utilizando la funciónadd_constant()
destatsmodels
(importada comosm
). - Inicializar el objeto
OLS
y entrenarlo. - Preprocesar el arreglo
X_new
de la misma manera queX
. - Predecir el objetivo para la matriz
X_new_tilde
.
Solución
¡Gracias por tus comentarios!
single
Awesome!
Completion rate improved to 5.26
Desafío: Predicción de Precios de Viviendas
Desliza para mostrar el menú
Ahora construirás un modelo de regresión con un ejemplo del mundo real. Tienes un archivo, houses_simple.csv
, que contiene información sobre los precios de viviendas con su área como característica.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
El siguiente paso es asignar variables y visualizar el conjunto de datos:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
En el ejemplo con la altura de una persona, era mucho más sencillo imaginar una línea que se ajustara bien a los datos.
Sin embargo, ahora nuestros datos presentan mucha más variabilidad, ya que el objetivo depende en gran medida de otros factores como la antigüedad, ubicación, interior, etc.
De todas formas, la tarea consiste en construir la línea que mejor se ajuste a los datos disponibles; esta mostrará la tendencia. Para ello, se debe utilizar la clase OLS
. Pronto aprenderemos cómo añadir más características, lo que mejorará la predicción.
Swipe to start coding
- Asignar la columna
'price'
dedf
ay
. - Crear la matriz
X_tilde
utilizando la funciónadd_constant()
destatsmodels
(importada comosm
). - Inicializar el objeto
OLS
y entrenarlo. - Preprocesar el arreglo
X_new
de la misma manera queX
. - Predecir el objetivo para la matriz
X_new_tilde
.
Solución
¡Gracias por tus comentarios!