Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Codificação de Variáveis Categóricas | Pré-Processamento de Dados com Scikit-Learn
Introdução ao ML com Scikit-Learn

bookDesafio: Codificação de Variáveis Categóricas

Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:

Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.

Segue um lembrete da estrutura do conjunto de dados:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.

Tarefa

Swipe to start coding

Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.

  1. Importe as classes OneHotEncoder e LabelEncoder de sklearn.preprocessing.
  2. Separe a matriz de atributos X e a variável alvo y do DataFrame.
  3. Crie um objeto OneHotEncoder e aplique-o às colunas 'island' e 'sex' em X.
  4. Substitua as colunas categóricas originais pelas codificadas.
  5. Crie um objeto LabelEncoder e aplique-o à coluna 'species' para codificar a variável alvo y.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 8
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 3.13

bookDesafio: Codificação de Variáveis Categóricas

Deslize para mostrar o menu

Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:

Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.

Segue um lembrete da estrutura do conjunto de dados:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.

Tarefa

Swipe to start coding

Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.

  1. Importe as classes OneHotEncoder e LabelEncoder de sklearn.preprocessing.
  2. Separe a matriz de atributos X e a variável alvo y do DataFrame.
  3. Crie um objeto OneHotEncoder e aplique-o às colunas 'island' e 'sex' em X.
  4. Substitua as colunas categóricas originais pelas codificadas.
  5. Crie um objeto LabelEncoder e aplique-o à coluna 'species' para codificar a variável alvo y.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 8
single

single

some-alt