Desafio: Criando um Pipeline
Neste desafio, combine todas as etapas de pré-processamento em um único pipeline usando o dataset original penguins.csv
.
- Remova as duas linhas com dados insuficientes.
- Construa um pipeline que inclua codificação, imputação e padronização.
É necessário codificar apenas duas colunas, 'sex'
e 'island'
. Como não se deseja codificar todo o X
, é obrigatório utilizar um ColumnTransformer
. Em seguida, aplique o SimpleImputer
e o StandardScaler
em todo o X
.
Aqui está um lembrete das funções make_column_transformer()
e make_pipeline()
que serão utilizadas.
Swipe to start coding
- Importar a função correta para criar um pipeline.
- Criar um
ColumnTransformer
com oOneHotEncoder
aplicado apenas às colunas'sex'
e'island'
. - Garantir que todas as outras colunas permaneçam inalteradas.
- Criar um pipeline contendo o
ct
que você acabou de criar, umSimpleImputer
que preenche valores ausentes com o valor mais frequente e umStandardScaler
como etapa final. - Transformar o
X
utilizando opipe
que você criou.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.13
Desafio: Criando um Pipeline
Deslize para mostrar o menu
Neste desafio, combine todas as etapas de pré-processamento em um único pipeline usando o dataset original penguins.csv
.
- Remova as duas linhas com dados insuficientes.
- Construa um pipeline que inclua codificação, imputação e padronização.
É necessário codificar apenas duas colunas, 'sex'
e 'island'
. Como não se deseja codificar todo o X
, é obrigatório utilizar um ColumnTransformer
. Em seguida, aplique o SimpleImputer
e o StandardScaler
em todo o X
.
Aqui está um lembrete das funções make_column_transformer()
e make_pipeline()
que serão utilizadas.
Swipe to start coding
- Importar a função correta para criar um pipeline.
- Criar um
ColumnTransformer
com oOneHotEncoder
aplicado apenas às colunas'sex'
e'island'
. - Garantir que todas as outras colunas permaneçam inalteradas.
- Criar um pipeline contendo o
ct
que você acabou de criar, umSimpleImputer
que preenche valores ausentes com o valor mais frequente e umStandardScaler
como etapa final. - Transformar o
X
utilizando opipe
que você criou.
Solução
Obrigado pelo seu feedback!
Awesome!
Completion rate improved to 3.13single