Desafio: Integrando Tudo
Neste desafio, será necessário aplicar todo o conhecimento adquirido ao longo do curso, desde o pré-processamento de dados até o treinamento e avaliação do modelo.





Tarefa
Swipe to start coding
- Codificação do alvo.
- Divisão dos dados de modo que 33% seja utilizado para o conjunto de teste e o restante para o conjunto de treinamento.
- Criação de um
ColumnTransformer
para codificar apenas as colunas'island'
e'sex'
. As demais colunas devem permanecer inalteradas. Utilização de um codificador apropriado para dados nominais. - Preenchimento das lacunas em um
param_grid
para testar os seguintes valores para o número de vizinhos:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Criação de um objeto
GridSearchCV
com oKNeighborsClassifier
como modelo. - Construção de um pipeline que inicia com
ct
como o primeiro passo, seguido de imputação utilizando o valor mais frequente, padronização e finalizando com oGridSearchCV
como estimador final. - Treinamento do modelo utilizando o pipeline no conjunto de treinamento.
- Avaliação do modelo no conjunto de teste. (Imprimir o score)
- Obtenção da predição do alvo para
X_test
. - Impressão do melhor estimador encontrado pelo
grid_search
.
Solução
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 4. Capítulo 10
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.13
Desafio: Integrando Tudo
Deslize para mostrar o menu
Neste desafio, será necessário aplicar todo o conhecimento adquirido ao longo do curso, desde o pré-processamento de dados até o treinamento e avaliação do modelo.





Tarefa
Swipe to start coding
- Codificação do alvo.
- Divisão dos dados de modo que 33% seja utilizado para o conjunto de teste e o restante para o conjunto de treinamento.
- Criação de um
ColumnTransformer
para codificar apenas as colunas'island'
e'sex'
. As demais colunas devem permanecer inalteradas. Utilização de um codificador apropriado para dados nominais. - Preenchimento das lacunas em um
param_grid
para testar os seguintes valores para o número de vizinhos:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Criação de um objeto
GridSearchCV
com oKNeighborsClassifier
como modelo. - Construção de um pipeline que inicia com
ct
como o primeiro passo, seguido de imputação utilizando o valor mais frequente, padronização e finalizando com oGridSearchCV
como estimador final. - Treinamento do modelo utilizando o pipeline no conjunto de treinamento.
- Avaliação do modelo no conjunto de teste. (Imprimir o score)
- Obtenção da predição do alvo para
X_test
. - Impressão do melhor estimador encontrado pelo
grid_search
.
Solução
Tudo estava claro?
Obrigado pelo seu feedback!
Awesome!
Completion rate improved to 3.13Seção 4. Capítulo 10
single