Desafio: Imputação de Valores Ausentes
A classe SimpleImputer substitui valores ausentes automaticamente.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Principais parâmetros:
missing_value: marcador considerado como ausente (padrãonp.nan);strategy: método para preenchimento das lacunas ('mean'por padrão);fill_value: utilizado quandostrategy='constant'.
Como transformador, fornece métodos como .fit(), .transform() e .fit_transform().
A escolha de como preencher dados ausentes é fundamental. Abordagem comum:
- variáveis numéricas → média;
- variáveis categóricas → valor mais frequente.
Opções de strategy:
'mean'— preencher com a média;'median'— preencher com a mediana;'most_frequent'— preencher com a moda;'constant'— preencher com um valor especificado viafill_value.
missing_values define quais valores são tratados como ausentes (padrão NaN, mas pode ser '' ou outro marcador).
SimpleImputer espera um DataFrame, não uma Series.
Um DataFrame de coluna única deve ser selecionado usando colchetes duplos:
imputer.fit_transform(df[['column']])
fit_transform() retorna um array 2D, mas atribuir de volta a uma coluna do DataFrame requer um array 1D.
Achatamento do resultado usando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Você recebe um DataFrame df contendo dados de pinguins. A coluna 'sex' possui valores ausentes. Preencha-os utilizando a categoria mais frequente.
- Importe
SimpleImputer; - Crie um imputador com
strategy='most_frequent'; - Aplique-o em
df[['sex']]; - Atribua os valores imputados de volta a
df['sex'].
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.13
Desafio: Imputação de Valores Ausentes
Deslize para mostrar o menu
A classe SimpleImputer substitui valores ausentes automaticamente.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Principais parâmetros:
missing_value: marcador considerado como ausente (padrãonp.nan);strategy: método para preenchimento das lacunas ('mean'por padrão);fill_value: utilizado quandostrategy='constant'.
Como transformador, fornece métodos como .fit(), .transform() e .fit_transform().
A escolha de como preencher dados ausentes é fundamental. Abordagem comum:
- variáveis numéricas → média;
- variáveis categóricas → valor mais frequente.
Opções de strategy:
'mean'— preencher com a média;'median'— preencher com a mediana;'most_frequent'— preencher com a moda;'constant'— preencher com um valor especificado viafill_value.
missing_values define quais valores são tratados como ausentes (padrão NaN, mas pode ser '' ou outro marcador).
SimpleImputer espera um DataFrame, não uma Series.
Um DataFrame de coluna única deve ser selecionado usando colchetes duplos:
imputer.fit_transform(df[['column']])
fit_transform() retorna um array 2D, mas atribuir de volta a uma coluna do DataFrame requer um array 1D.
Achatamento do resultado usando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Você recebe um DataFrame df contendo dados de pinguins. A coluna 'sex' possui valores ausentes. Preencha-os utilizando a categoria mais frequente.
- Importe
SimpleImputer; - Crie um imputador com
strategy='most_frequent'; - Aplique-o em
df[['sex']]; - Atribua os valores imputados de volta a
df['sex'].
Solução
Obrigado pelo seu feedback!
single