Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Codificação de Variáveis Categóricas | Pré-Processamento de Dados com Scikit-Learn
Introdução ao ML com Scikit-Learn

bookDesafio: Codificação de Variáveis Categóricas

Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:

Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.

Segue um lembrete da estrutura do conjunto de dados:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.

Tarefa

Swipe to start coding

Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.

  1. Importe as classes OneHotEncoder e LabelEncoder de sklearn.preprocessing.
  2. Separe a matriz de atributos X e a variável alvo y do DataFrame.
  3. Crie um objeto OneHotEncoder e aplique-o às colunas 'island' e 'sex' em X.
  4. Substitua as colunas categóricas originais pelas codificadas.
  5. Crie um objeto LabelEncoder e aplique-o à coluna 'species' para codificar a variável alvo y.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 8
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookDesafio: Codificação de Variáveis Categóricas

Deslize para mostrar o menu

Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:

Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.

Segue um lembrete da estrutura do conjunto de dados:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.

Tarefa

Swipe to start coding

Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.

  1. Importe as classes OneHotEncoder e LabelEncoder de sklearn.preprocessing.
  2. Separe a matriz de atributos X e a variável alvo y do DataFrame.
  3. Crie um objeto OneHotEncoder e aplique-o às colunas 'island' e 'sex' em X.
  4. Substitua as colunas categóricas originais pelas codificadas.
  5. Crie um objeto LabelEncoder e aplique-o à coluna 'species' para codificar a variável alvo y.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 8
single

single

some-alt