Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Codificação de Variáveis Categóricas | Pré-Processamento de Dados com Scikit-Learn
Introdução ao Aprendizado de Máquina com Python

bookDesafio: Codificação de Variáveis Categóricas

Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:

Neste desafio, utilize o conjunto de dados dos pinguins (sem valores ausentes). Todos os atributos categóricos — incluindo o alvo 'species' — devem ser codificados para uso em ML.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.

Tarefa

Swipe to start coding

Você recebe um DataFrame df. Codifique todas as colunas categóricas:

  1. Importe OneHotEncoder e LabelEncoder de sklearn.preprocessing.
  2. Separe os dados em X (características) e y (alvo).
  3. Crie um OneHotEncoder e aplique-o às colunas 'island' e 'sex' em X.
  4. Substitua essas colunas originais por suas versões codificadas.
  5. Utilize o LabelEncoder na coluna 'species' para codificar y.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 8
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

What are the steps to encode the categorical features and target in this dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

How do I choose which encoder to use for each column in the penguins dataset?

close

Awesome!

Completion rate improved to 3.13

bookDesafio: Codificação de Variáveis Categóricas

Deslize para mostrar o menu

Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:

Neste desafio, utilize o conjunto de dados dos pinguins (sem valores ausentes). Todos os atributos categóricos — incluindo o alvo 'species' — devem ser codificados para uso em ML.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.

Tarefa

Swipe to start coding

Você recebe um DataFrame df. Codifique todas as colunas categóricas:

  1. Importe OneHotEncoder e LabelEncoder de sklearn.preprocessing.
  2. Separe os dados em X (características) e y (alvo).
  3. Crie um OneHotEncoder e aplique-o às colunas 'island' e 'sex' em X.
  4. Substitua essas colunas originais por suas versões codificadas.
  5. Utilize o LabelEncoder na coluna 'species' para codificar y.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 8
single

single

some-alt