Desafío: Imputación de Valores Faltantes
La clase SimpleImputer reemplaza automáticamente los valores faltantes.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Sus parámetros clave:
missing_value: marcador considerado como valor faltante (por defectonp.nan);strategy: método para rellenar los huecos ('mean'por defecto);fill_value: utilizado cuandostrategy='constant'.
Como transformador, proporciona métodos como .fit(), .transform() y .fit_transform().
Elegir cómo rellenar los datos faltantes es esencial. Un enfoque común:
- características numéricas → media;
- características categóricas → valor más frecuente.
Opciones de strategy:
'mean'— rellenar con la media;'median'— rellenar con la mediana;'most_frequent'— rellenar con la moda;'constant'— rellenar con un valor especificado mediantefill_value.
missing_values define qué valores se consideran como faltantes (por defecto NaN, pero puede ser '' u otro marcador).
SimpleImputer espera un DataFrame, no una Serie.
Un DataFrame de una sola columna debe seleccionarse usando doble corchete:
imputer.fit_transform(df[['column']])
fit_transform() devuelve un array 2D, pero asignar de nuevo a una columna de un DataFrame requiere un array 1D.
Aplane el resultado usando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Se proporciona un DataFrame df que contiene datos de pingüinos. La columna 'sex' tiene valores faltantes. Complételos utilizando la categoría más frecuente.
- Importar
SimpleImputer; - Crear un imputador con
strategy='most_frequent'; - Aplicarlo a
df[['sex']]; - Asignar los valores imputados de nuevo a
df['sex'].
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Desafío: Imputación de Valores Faltantes
Desliza para mostrar el menú
La clase SimpleImputer reemplaza automáticamente los valores faltantes.
from sklearn.impute import SimpleImputer
imputer = SimpleImputer()
Sus parámetros clave:
missing_value: marcador considerado como valor faltante (por defectonp.nan);strategy: método para rellenar los huecos ('mean'por defecto);fill_value: utilizado cuandostrategy='constant'.
Como transformador, proporciona métodos como .fit(), .transform() y .fit_transform().
Elegir cómo rellenar los datos faltantes es esencial. Un enfoque común:
- características numéricas → media;
- características categóricas → valor más frecuente.
Opciones de strategy:
'mean'— rellenar con la media;'median'— rellenar con la mediana;'most_frequent'— rellenar con la moda;'constant'— rellenar con un valor especificado mediantefill_value.
missing_values define qué valores se consideran como faltantes (por defecto NaN, pero puede ser '' u otro marcador).
SimpleImputer espera un DataFrame, no una Serie.
Un DataFrame de una sola columna debe seleccionarse usando doble corchete:
imputer.fit_transform(df[['column']])
fit_transform() devuelve un array 2D, pero asignar de nuevo a una columna de un DataFrame requiere un array 1D.
Aplane el resultado usando .ravel():
df['column'] = imputer.fit_transform(df[['column']]).ravel()
Swipe to start coding
Se proporciona un DataFrame df que contiene datos de pingüinos. La columna 'sex' tiene valores faltantes. Complételos utilizando la categoría más frecuente.
- Importar
SimpleImputer; - Crear un imputador con
strategy='most_frequent'; - Aplicarlo a
df[['sex']]; - Asignar los valores imputados de nuevo a
df['sex'].
Solución
¡Gracias por tus comentarios!
single