Desafio: Codificação de Variáveis Categóricas
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.
Segue um lembrete da estrutura do conjunto de dados:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.
Swipe to start coding
Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.
- Importe as classes
OneHotEncodereLabelEncoderdesklearn.preprocessing. - Separe a matriz de atributos
Xe a variável alvoydoDataFrame. - Crie um objeto
OneHotEncodere aplique-o às colunas'island'e'sex'emX. - Substitua as colunas categóricas originais pelas codificadas.
- Crie um objeto
LabelEncodere aplique-o à coluna'species'para codificar a variável alvoy.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.13
Desafio: Codificação de Variáveis Categóricas
Deslize para mostrar o menu
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'), devem ser codificados.
Segue um lembrete da estrutura do conjunto de dados:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.
Swipe to start coding
Você recebe um DataFrame chamado df que contém dados de pinguins.
Sua tarefa é codificar todas as variáveis categóricas para que os dados possam ser utilizados em um modelo de aprendizado de máquina.
- Importe as classes
OneHotEncodereLabelEncoderdesklearn.preprocessing. - Separe a matriz de atributos
Xe a variável alvoydoDataFrame. - Crie um objeto
OneHotEncodere aplique-o às colunas'island'e'sex'emX. - Substitua as colunas categóricas originais pelas codificadas.
- Crie um objeto
LabelEncodere aplique-o à coluna'species'para codificar a variável alvoy.
Solução
Obrigado pelo seu feedback!
single