Desafio: Previsão de Preços Usando Regressão Polinomial
Neste desafio, será necessário construir a mesma Regressão Polinomial de grau 2 do desafio anterior. No entanto, será preciso dividir o conjunto em um conjunto de treinamento e um conjunto de teste para calcular o RMSE para ambos. Isso é necessário para avaliar se o modelo está sofrendo overfitting ou underfitting.
Segue um lembrete da função train_test_split()
que você deverá utilizar.
E também um lembrete da função mean_squared_error()
necessária para calcular o RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Atribua o DataFrame com uma única coluna
'age'
dedf
à variávelX
. - Pré-processe
X
utilizando a classePolynomialFeatures
. - Divida o conjunto de dados utilizando a função apropriada do
sklearn
. - Construa e treine um modelo no conjunto de treinamento.
- Realize previsões dos alvos tanto para o conjunto de treinamento quanto para o de teste.
- Calcule o RMSE para ambos os conjuntos, treinamento e teste.
- Imprima a tabela de resumo.
Solução
Ao concluir a tarefa, você notará que o RMSE do teste é ainda menor que o RMSE do treinamento. Normalmente, os modelos não apresentam resultados melhores em instâncias não vistas. Aqui, a diferença é pequena e causada pelo acaso. Nosso conjunto de dados é relativamente pequeno e, ao dividir, o conjunto de teste recebeu pontos de dados um pouco melhores (mais fáceis de prever).
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 5.26
Desafio: Previsão de Preços Usando Regressão Polinomial
Deslize para mostrar o menu
Neste desafio, será necessário construir a mesma Regressão Polinomial de grau 2 do desafio anterior. No entanto, será preciso dividir o conjunto em um conjunto de treinamento e um conjunto de teste para calcular o RMSE para ambos. Isso é necessário para avaliar se o modelo está sofrendo overfitting ou underfitting.
Segue um lembrete da função train_test_split()
que você deverá utilizar.
E também um lembrete da função mean_squared_error()
necessária para calcular o RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Atribua o DataFrame com uma única coluna
'age'
dedf
à variávelX
. - Pré-processe
X
utilizando a classePolynomialFeatures
. - Divida o conjunto de dados utilizando a função apropriada do
sklearn
. - Construa e treine um modelo no conjunto de treinamento.
- Realize previsões dos alvos tanto para o conjunto de treinamento quanto para o de teste.
- Calcule o RMSE para ambos os conjuntos, treinamento e teste.
- Imprima a tabela de resumo.
Solução
Ao concluir a tarefa, você notará que o RMSE do teste é ainda menor que o RMSE do treinamento. Normalmente, os modelos não apresentam resultados melhores em instâncias não vistas. Aqui, a diferença é pequena e causada pelo acaso. Nosso conjunto de dados é relativamente pequeno e, ao dividir, o conjunto de teste recebeu pontos de dados um pouco melhores (mais fáceis de prever).
Obrigado pelo seu feedback!
single