Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Pré-processamento do Conjunto de Dados | Conceitos Centrais
Análise de Clusters com Python
Seção 2. Capítulo 6
single

single

bookDesafio: Pré-processamento do Conjunto de Dados

Deslize para mostrar o menu

Tarefa

Swipe to start coding

Você recebe um conjunto de dados sintético armazenado na variável data. Sua tarefa é tratar valores ausentes e codificar adequadamente as variáveis categóricas.

Siga estes passos:

  • Substitua os valores ausentes na coluna 'Age' pela média dessa coluna. Sobrescreva a coluna original com o resultado.
  • Crie uma instância de OneHotEncoder e armazene-a na variável city_encoder. Certifique-se de especificar drop='first' para evitar o problema de multicolinearidade.
  • Por padrão, esse codificador retorna uma matriz esparsa. Para garantir compatibilidade com o Pandas posteriormente, defina o parâmetro sparse_output=False (ou sparse=False em versões antigas) durante a inicialização, OU adicione .toarray() ao transformar os dados.
  • Codifique os valores da coluna 'City' usando city_encoder.fit_transform() e armazene o array resultante na variável city_encoded.
  • Crie uma instância de OrdinalEncoder e armazene-a na variável income_encoder. Como os dados possuem uma hierarquia natural, defina explicitamente a ordem usando o parâmetro categories (observe que 'Low' < 'Middle' < 'High').
  • Codifique os valores da coluna 'Income' usando income_encoder e sobrescreva a coluna original 'Income' com o resultado.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 6
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

some-alt