Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Imputação de Valores Ausentes | Pré-Processamento de Dados com Scikit-Learn
Introdução ao Aprendizado de Máquina com Python

bookDesafio: Imputação de Valores Ausentes

A classe SimpleImputer substitui valores ausentes automaticamente.

from sklearn.impute import SimpleImputer
imputer = SimpleImputer()

Principais parâmetros:

  • missing_value: marcador considerado como ausente (padrão np.nan);
  • strategy: método para preenchimento das lacunas ('mean' por padrão);
  • fill_value: utilizado quando strategy='constant'.

Como transformador, fornece métodos como .fit(), .transform() e .fit_transform().

A escolha de como preencher dados ausentes é fundamental. Abordagem comum:

  • variáveis numéricas → média;
  • variáveis categóricas → valor mais frequente.

Opções de strategy:

  • 'mean' — preencher com a média;
  • 'median' — preencher com a mediana;
  • 'most_frequent' — preencher com a moda;
  • 'constant' — preencher com um valor especificado via fill_value.

missing_values define quais valores são tratados como ausentes (padrão NaN, mas pode ser '' ou outro marcador).

Note
Nota

SimpleImputer espera um DataFrame, não uma Series. Um DataFrame de coluna única deve ser selecionado usando colchetes duplos:

imputer.fit_transform(df[['column']])

fit_transform() retorna um array 2D, mas atribuir de volta a uma coluna do DataFrame requer um array 1D. Achatamento do resultado usando .ravel():

df['column'] = imputer.fit_transform(df[['column']]).ravel()
Tarefa

Swipe to start coding

Você recebe um DataFrame df contendo dados de pinguins. A coluna 'sex' possui valores ausentes. Preencha-os utilizando a categoria mais frequente.

  1. Importe SimpleImputer;
  2. Crie um imputador com strategy='most_frequent';
  3. Aplique-o em df[['sex']];
  4. Atribua os valores imputados de volta a df['sex'].

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 4
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 3.13

bookDesafio: Imputação de Valores Ausentes

Deslize para mostrar o menu

A classe SimpleImputer substitui valores ausentes automaticamente.

from sklearn.impute import SimpleImputer
imputer = SimpleImputer()

Principais parâmetros:

  • missing_value: marcador considerado como ausente (padrão np.nan);
  • strategy: método para preenchimento das lacunas ('mean' por padrão);
  • fill_value: utilizado quando strategy='constant'.

Como transformador, fornece métodos como .fit(), .transform() e .fit_transform().

A escolha de como preencher dados ausentes é fundamental. Abordagem comum:

  • variáveis numéricas → média;
  • variáveis categóricas → valor mais frequente.

Opções de strategy:

  • 'mean' — preencher com a média;
  • 'median' — preencher com a mediana;
  • 'most_frequent' — preencher com a moda;
  • 'constant' — preencher com um valor especificado via fill_value.

missing_values define quais valores são tratados como ausentes (padrão NaN, mas pode ser '' ou outro marcador).

Note
Nota

SimpleImputer espera um DataFrame, não uma Series. Um DataFrame de coluna única deve ser selecionado usando colchetes duplos:

imputer.fit_transform(df[['column']])

fit_transform() retorna um array 2D, mas atribuir de volta a uma coluna do DataFrame requer um array 1D. Achatamento do resultado usando .ravel():

df['column'] = imputer.fit_transform(df[['column']]).ravel()
Tarefa

Swipe to start coding

Você recebe um DataFrame df contendo dados de pinguins. A coluna 'sex' possui valores ausentes. Preencha-os utilizando a categoria mais frequente.

  1. Importe SimpleImputer;
  2. Crie um imputador com strategy='most_frequent';
  3. Aplique-o em df[['sex']];
  4. Atribua os valores imputados de volta a df['sex'].

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 4
single

single

some-alt