Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Integrando Tudo | Modelagem
Introdução ao ML com Scikit-Learn

bookDesafio: Integrando Tudo

Neste desafio, aplique todo o fluxo de trabalho aprendido no curso — desde o pré-processamento dos dados até o treinamento e avaliação do modelo.

Tarefa

Swipe to start coding

Você recebe um conjunto de dados de pinguins. Seu objetivo é construir um pipeline de aprendizado de máquina que classifique as espécies de pinguins utilizando um modelo K-Nearest Neighbors (KNN), tratando adequadamente a codificação, valores ausentes e otimização de parâmetros.

  1. Codifique a variável alvo usando LabelEncoder.
  2. Divida o conjunto de dados em conjuntos de treino e teste com test_size=0.33.
  3. Crie um ColumnTransformer (ct) que codifique apenas as colunas 'island' e 'sex' utilizando um codificador apropriado para dados nominais (OneHotEncoder) e mantenha as demais colunas inalteradas.
  4. Defina um grid de parâmetros (param_grid) que inclua os seguintes valores para n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Crie um objeto GridSearchCV com KNeighborsClassifier como estimador base e param_grid como seus parâmetros.
  6. Construa um pipeline composto por:
  • o ColumnTransformer (ct);
  • um SimpleImputer (strategy = 'most_frequent');
  • um StandardScaler;
  • e o GridSearchCV como etapa final.
  1. Treine o pipeline utilizando os dados de treino (X_train, y_train).
  2. Avalie o modelo nos dados de teste imprimindo seu .score(X_test, y_test).
  3. Realize previsões no conjunto de teste e imprima as primeiras 5 previsões decodificadas usando label_enc.inverse_transform().
  4. Por fim, imprima o melhor estimador encontrado pelo GridSearchCV.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 10
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 3.13

bookDesafio: Integrando Tudo

Deslize para mostrar o menu

Neste desafio, aplique todo o fluxo de trabalho aprendido no curso — desde o pré-processamento dos dados até o treinamento e avaliação do modelo.

Tarefa

Swipe to start coding

Você recebe um conjunto de dados de pinguins. Seu objetivo é construir um pipeline de aprendizado de máquina que classifique as espécies de pinguins utilizando um modelo K-Nearest Neighbors (KNN), tratando adequadamente a codificação, valores ausentes e otimização de parâmetros.

  1. Codifique a variável alvo usando LabelEncoder.
  2. Divida o conjunto de dados em conjuntos de treino e teste com test_size=0.33.
  3. Crie um ColumnTransformer (ct) que codifique apenas as colunas 'island' e 'sex' utilizando um codificador apropriado para dados nominais (OneHotEncoder) e mantenha as demais colunas inalteradas.
  4. Defina um grid de parâmetros (param_grid) que inclua os seguintes valores para n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Crie um objeto GridSearchCV com KNeighborsClassifier como estimador base e param_grid como seus parâmetros.
  6. Construa um pipeline composto por:
  • o ColumnTransformer (ct);
  • um SimpleImputer (strategy = 'most_frequent');
  • um StandardScaler;
  • e o GridSearchCV como etapa final.
  1. Treine o pipeline utilizando os dados de treino (X_train, y_train).
  2. Avalie o modelo nos dados de teste imprimindo seu .score(X_test, y_test).
  3. Realize previsões no conjunto de teste e imprima as primeiras 5 previsões decodificadas usando label_enc.inverse_transform().
  4. Por fim, imprima o melhor estimador encontrado pelo GridSearchCV.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 10
single

single

some-alt