Desafio: Previsão de Preços de Casas
Agora você irá construir um modelo de regressão aplicado a um exemplo do mundo real. Você possui um arquivo, houses_simple.csv, que contém informações sobre preços de casas, tendo a área como uma das características.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
O próximo passo é atribuir variáveis e visualizar o conjunto de dados:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
No exemplo com a altura de uma pessoa, era muito mais fácil imaginar uma linha ajustando-se bem aos dados.
Porém, agora nossos dados apresentam muito mais variância, pois o alvo depende fortemente de muitos outros fatores, como idade, localização, interior, etc.
De qualquer forma, o objetivo é construir a linha que melhor se ajusta aos dados disponíveis; ela mostrará a tendência. A classe LinearRegression do scikit-learn deve ser utilizada para isso.
Swipe to start coding
- Atribua a coluna
'price'dedfà variávely. - Crie a variável
X_reshapedremodelandoXem um array 2D usando.values.reshape(-1, 1). - Inicialize o modelo
LinearRegressione treine-o utilizandoX_reshapedey. - Crie
X_new_reshapedremodelandoX_newda mesma forma. - Realize a previsão do alvo para
X_new_reshaped.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Incrível!
Completion taxa melhorada para 3.33
Desafio: Previsão de Preços de Casas
Deslize para mostrar o menu
Agora você irá construir um modelo de regressão aplicado a um exemplo do mundo real. Você possui um arquivo, houses_simple.csv, que contém informações sobre preços de casas, tendo a área como uma das características.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
O próximo passo é atribuir variáveis e visualizar o conjunto de dados:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
No exemplo com a altura de uma pessoa, era muito mais fácil imaginar uma linha ajustando-se bem aos dados.
Porém, agora nossos dados apresentam muito mais variância, pois o alvo depende fortemente de muitos outros fatores, como idade, localização, interior, etc.
De qualquer forma, o objetivo é construir a linha que melhor se ajusta aos dados disponíveis; ela mostrará a tendência. A classe LinearRegression do scikit-learn deve ser utilizada para isso.
Swipe to start coding
- Atribua a coluna
'price'dedfà variávely. - Crie a variável
X_reshapedremodelandoXem um array 2D usando.values.reshape(-1, 1). - Inicialize o modelo
LinearRegressione treine-o utilizandoX_reshapedey. - Crie
X_new_reshapedremodelandoX_newda mesma forma. - Realize a previsão do alvo para
X_new_reshaped.
Solução
Obrigado pelo seu feedback!
single