Desafio: Previsão de Preços Usando Regressão Polinomial
Neste desafio, será necessário construir a mesma Regressão Polinomial de grau 2 do desafio anterior. No entanto, será preciso dividir o conjunto em um conjunto de treinamento e um conjunto de teste para calcular o RMSE para ambos. Isso é necessário para avaliar se o modelo está sofrendo de overfitting ou underfitting.
Segue um lembrete da função train_test_split()
que deverá ser utilizada.
E também um lembrete da função mean_squared_error()
necessária para calcular o RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Atribuir o DataFrame com uma única coluna
'age'
dedf
à variávelX
. - Pré-processar o
X
utilizando a classePolynomialFeatures
. - Dividir o conjunto de dados utilizando a função apropriada do
sklearn
. - Construir e treinar um modelo no conjunto de treinamento.
- Prever os alvos tanto do conjunto de treinamento quanto do conjunto de teste.
- Calcular o RMSE para ambos os conjuntos de treinamento e teste.
- Exibir a tabela resumo.
Solução
Ao concluir a tarefa, será possível notar que o RMSE do teste é ainda menor do que o RMSE do treinamento. Normalmente, os modelos não apresentam resultados melhores em instâncias não vistas. Neste caso, a diferença é pequena e ocorre por acaso. Nosso conjunto de dados é relativamente pequeno e, ao dividir, o conjunto de teste recebeu pontos de dados um pouco melhores (mais fáceis de prever).
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 5.26
Desafio: Previsão de Preços Usando Regressão Polinomial
Deslize para mostrar o menu
Neste desafio, será necessário construir a mesma Regressão Polinomial de grau 2 do desafio anterior. No entanto, será preciso dividir o conjunto em um conjunto de treinamento e um conjunto de teste para calcular o RMSE para ambos. Isso é necessário para avaliar se o modelo está sofrendo de overfitting ou underfitting.
Segue um lembrete da função train_test_split()
que deverá ser utilizada.
E também um lembrete da função mean_squared_error()
necessária para calcular o RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Atribuir o DataFrame com uma única coluna
'age'
dedf
à variávelX
. - Pré-processar o
X
utilizando a classePolynomialFeatures
. - Dividir o conjunto de dados utilizando a função apropriada do
sklearn
. - Construir e treinar um modelo no conjunto de treinamento.
- Prever os alvos tanto do conjunto de treinamento quanto do conjunto de teste.
- Calcular o RMSE para ambos os conjuntos de treinamento e teste.
- Exibir a tabela resumo.
Solução
Ao concluir a tarefa, será possível notar que o RMSE do teste é ainda menor do que o RMSE do treinamento. Normalmente, os modelos não apresentam resultados melhores em instâncias não vistas. Neste caso, a diferença é pequena e ocorre por acaso. Nosso conjunto de dados é relativamente pequeno e, ao dividir, o conjunto de teste recebeu pontos de dados um pouco melhores (mais fáceis de prever).
Obrigado pelo seu feedback!
Awesome!
Completion rate improved to 5.26single