Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Imputación de Valores Faltantes | Preprocesamiento de Datos con Scikit-learn
Quizzes & Challenges
Quizzes
Challenges
/
Introducción al Aprendizaje Automático con Python

bookDesafío: Imputación de Valores Faltantes

La clase SimpleImputer reemplaza automáticamente los valores faltantes.

from sklearn.impute import SimpleImputer
imputer = SimpleImputer()

Sus parámetros clave:

  • missing_value: marcador considerado como valor faltante (por defecto np.nan);
  • strategy: método para rellenar los huecos ('mean' por defecto);
  • fill_value: utilizado cuando strategy='constant'.

Como transformador, proporciona métodos como .fit(), .transform() y .fit_transform().

Elegir cómo rellenar los datos faltantes es esencial. Un enfoque común:

  • características numéricas → media;
  • características categóricas → valor más frecuente.

Opciones de strategy:

  • 'mean' — rellenar con la media;
  • 'median' — rellenar con la mediana;
  • 'most_frequent' — rellenar con la moda;
  • 'constant' — rellenar con un valor especificado mediante fill_value.

missing_values define qué valores se consideran como faltantes (por defecto NaN, pero puede ser '' u otro marcador).

Note
Nota

SimpleImputer espera un DataFrame, no una Serie. Un DataFrame de una sola columna debe seleccionarse usando doble corchete:

imputer.fit_transform(df[['column']])

fit_transform() devuelve un array 2D, pero asignar de nuevo a una columna de un DataFrame requiere un array 1D. Aplane el resultado usando .ravel():

df['column'] = imputer.fit_transform(df[['column']]).ravel()
Tarea

Swipe to start coding

Se proporciona un DataFrame df que contiene datos de pingüinos. La columna 'sex' tiene valores faltantes. Complételos utilizando la categoría más frecuente.

  1. Importar SimpleImputer;
  2. Crear un imputador con strategy='most_frequent';
  3. Aplicarlo a df[['sex']];
  4. Asignar los valores imputados de nuevo a df['sex'].

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

Awesome!

Completion rate improved to 3.13

bookDesafío: Imputación de Valores Faltantes

Desliza para mostrar el menú

La clase SimpleImputer reemplaza automáticamente los valores faltantes.

from sklearn.impute import SimpleImputer
imputer = SimpleImputer()

Sus parámetros clave:

  • missing_value: marcador considerado como valor faltante (por defecto np.nan);
  • strategy: método para rellenar los huecos ('mean' por defecto);
  • fill_value: utilizado cuando strategy='constant'.

Como transformador, proporciona métodos como .fit(), .transform() y .fit_transform().

Elegir cómo rellenar los datos faltantes es esencial. Un enfoque común:

  • características numéricas → media;
  • características categóricas → valor más frecuente.

Opciones de strategy:

  • 'mean' — rellenar con la media;
  • 'median' — rellenar con la mediana;
  • 'most_frequent' — rellenar con la moda;
  • 'constant' — rellenar con un valor especificado mediante fill_value.

missing_values define qué valores se consideran como faltantes (por defecto NaN, pero puede ser '' u otro marcador).

Note
Nota

SimpleImputer espera un DataFrame, no una Serie. Un DataFrame de una sola columna debe seleccionarse usando doble corchete:

imputer.fit_transform(df[['column']])

fit_transform() devuelve un array 2D, pero asignar de nuevo a una columna de un DataFrame requiere un array 1D. Aplane el resultado usando .ravel():

df['column'] = imputer.fit_transform(df[['column']]).ravel()
Tarea

Swipe to start coding

Se proporciona un DataFrame df que contiene datos de pingüinos. La columna 'sex' tiene valores faltantes. Complételos utilizando la categoría más frecuente.

  1. Importar SimpleImputer;
  2. Crear un imputador con strategy='most_frequent';
  3. Aplicarlo a df[['sex']];
  4. Asignar los valores imputados de nuevo a df['sex'].

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 4
single

single

some-alt