single
Desafio: Imputação de Valores Ausentes
Deslize para mostrar o menu
A classe SimpleImputer substitui valores ausentes automaticamente.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Principais parâmetros:
missing_value: marcador considerado como ausente (padrãonp.nan);strategy: método para preencher lacunas ('mean'por padrão);fill_value: utilizado quandostrategy='constant'.
Como transformador, fornece métodos como .fit(), .transform() e .fit_transform().
A escolha de como preencher dados ausentes é fundamental. Abordagem comum:
- variáveis numéricas → média;
- variáveis categóricas → valor mais frequente.
Opções de strategy:
'mean'— preenche com a média;'median'— preenche com a mediana;'most_frequent'— preenche com a moda;'constant'— preenche com um valor especificado viafill_value.
missing_values define quais valores são considerados ausentes (padrão NaN, mas pode ser '' ou outro marcador).
SimpleImputer espera um DataFrame, não uma Series.
Um DataFrame de uma única coluna deve ser selecionado usando colchetes duplos:
imputer.fit_transform(df[['column']])
fit_transform() retorna um array 2D, mas ao atribuir de volta a uma coluna do DataFrame é necessário um array 1D.
Achatamento do resultado usando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Deslize para começar a programar
Você recebe um DataFrame df contendo dados de pinguins. A coluna 'sex' possui valores ausentes. Preencha-os utilizando a categoria mais frequente.
- Importe
SimpleImputer; - Crie um imputador com
strategy='most_frequent'; - Aplique-o em
df[['sex']]; - Atribua os valores imputados de volta a
df['sex'].
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo