Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Pipeline de Pré-Processamento | Engenharia de Atributos para Aprendizado de Máquina
Pré-Processamento de Dados e Engenharia de Features

bookDesafio: Pipeline de Pré-Processamento

Tarefa

Swipe to start coding

Você recebeu o conjunto de dados Titanic da biblioteca seaborn. Sua tarefa é construir um pipeline completo de pré-processamento que realize todas as transformações essenciais de dados utilizadas antes do aprendizado de máquina.

Siga estes passos:

  1. Carregue o conjunto de dados usando sns.load_dataset("titanic").
  2. Trate os valores ausentes:
  • Colunas numéricas → preencher com a média.
  • Colunas categóricas → preencher com a moda.
  1. Codifique as variáveis categóricas sex e embarked utilizando pd.get_dummies().
  2. Escalone as colunas numéricas age e fare utilizando StandardScaler.
  3. Crie uma nova variável family_size = sibsp + parch + 1.
  4. Combine todas as transformações em uma função chamada preprocess_titanic(data) que retorna o DataFrame processado final.
  5. Atribua o conjunto de dados processado a uma variável chamada processed_data.

Exiba as 5 primeiras linhas do DataFrame final.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

bookDesafio: Pipeline de Pré-Processamento

Deslize para mostrar o menu

Tarefa

Swipe to start coding

Você recebeu o conjunto de dados Titanic da biblioteca seaborn. Sua tarefa é construir um pipeline completo de pré-processamento que realize todas as transformações essenciais de dados utilizadas antes do aprendizado de máquina.

Siga estes passos:

  1. Carregue o conjunto de dados usando sns.load_dataset("titanic").
  2. Trate os valores ausentes:
  • Colunas numéricas → preencher com a média.
  • Colunas categóricas → preencher com a moda.
  1. Codifique as variáveis categóricas sex e embarked utilizando pd.get_dummies().
  2. Escalone as colunas numéricas age e fare utilizando StandardScaler.
  3. Crie uma nova variável family_size = sibsp + parch + 1.
  4. Combine todas as transformações em uma função chamada preprocess_titanic(data) que retorna o DataFrame processado final.
  5. Atribua o conjunto de dados processado a uma variável chamada processed_data.

Exiba as 5 primeiras linhas do DataFrame final.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4
single

single

some-alt