Desafio: Codificação de Variáveis Categóricas
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.
Segue um lembrete da estrutura do conjunto de dados:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.
Swipe to start coding
Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.
- Importe as classes
OneHotEncodereLabelEncoderdesklearn.preprocessing. - Separe a matriz de atributos
Xe a variável alvoydoDataFrame. - Crie um objeto
OneHotEncodere aplique-o às colunas'island'e'sex'emX. - Substitua as colunas categóricas originais pelas codificadas.
- Crie um objeto
LabelEncodere aplique-o à coluna'species'para codificar a variável alvoy.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Desafio: Codificação de Variáveis Categóricas
Deslize para mostrar o menu
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.
Segue um lembrete da estrutura do conjunto de dados:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.
Swipe to start coding
Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.
- Importe as classes
OneHotEncodereLabelEncoderdesklearn.preprocessing. - Separe a matriz de atributos
Xe a variável alvoydoDataFrame. - Crie um objeto
OneHotEncodere aplique-o às colunas'island'e'sex'emX. - Substitua as colunas categóricas originais pelas codificadas.
- Crie um objeto
LabelEncodere aplique-o à coluna'species'para codificar a variável alvoy.
Solução
Obrigado pelo seu feedback!
single