Desafío: Imputación de Valores Faltantes
La clase SimpleImputer reemplaza automáticamente los valores faltantes.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Sus parámetros clave:
missing_value: marcador considerado como valor faltante (por defectonp.nan);strategy: método para rellenar los huecos ('mean'por defecto);fill_value: utilizado cuandostrategy='constant'.
Como transformador, proporciona métodos como .fit(), .transform() y .fit_transform().
Elegir cómo rellenar los datos faltantes es esencial. Un enfoque común:
- características numéricas → media;
- características categóricas → valor más frecuente.
Opciones de strategy:
'mean'— rellenar con la media;'median'— rellenar con la mediana;'most_frequent'— rellenar con la moda;'constant'— rellenar con un valor especificado mediantefill_value.
missing_values define qué valores se consideran como faltantes (por defecto NaN, pero puede ser '' u otro marcador).
SimpleImputer espera un DataFrame, no una Serie.
Un DataFrame de una sola columna debe seleccionarse usando doble corchete:
imputer.fit_transform(df[['column']])
fit_transform() devuelve un array 2D, pero asignar de nuevo a una columna de un DataFrame requiere un array 1D.
Aplane el resultado usando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Se proporciona un DataFrame df que contiene datos de pingüinos. La columna 'sex' tiene valores faltantes. Complételos utilizando la categoría más frecuente.
- Importar
SimpleImputer; - Crear un imputador con
strategy='most_frequent'; - Aplicarlo a
df[['sex']]; - Asignar los valores imputados de nuevo a
df['sex'].
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you explain how to use SimpleImputer with categorical data?
What happens if my data has multiple types of missing value markers?
Can you show an example of using a different strategy, like 'median'?
Genial!
Completion tasa mejorada a 3.13
Desafío: Imputación de Valores Faltantes
Desliza para mostrar el menú
La clase SimpleImputer reemplaza automáticamente los valores faltantes.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Sus parámetros clave:
missing_value: marcador considerado como valor faltante (por defectonp.nan);strategy: método para rellenar los huecos ('mean'por defecto);fill_value: utilizado cuandostrategy='constant'.
Como transformador, proporciona métodos como .fit(), .transform() y .fit_transform().
Elegir cómo rellenar los datos faltantes es esencial. Un enfoque común:
- características numéricas → media;
- características categóricas → valor más frecuente.
Opciones de strategy:
'mean'— rellenar con la media;'median'— rellenar con la mediana;'most_frequent'— rellenar con la moda;'constant'— rellenar con un valor especificado mediantefill_value.
missing_values define qué valores se consideran como faltantes (por defecto NaN, pero puede ser '' u otro marcador).
SimpleImputer espera un DataFrame, no una Serie.
Un DataFrame de una sola columna debe seleccionarse usando doble corchete:
imputer.fit_transform(df[['column']])
fit_transform() devuelve un array 2D, pero asignar de nuevo a una columna de un DataFrame requiere un array 1D.
Aplane el resultado usando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Se proporciona un DataFrame df que contiene datos de pingüinos. La columna 'sex' tiene valores faltantes. Complételos utilizando la categoría más frecuente.
- Importar
SimpleImputer; - Crear un imputador con
strategy='most_frequent'; - Aplicarlo a
df[['sex']]; - Asignar los valores imputados de nuevo a
df['sex'].
Solución
¡Gracias por tus comentarios!
single