Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Creación de un Pipeline | Pipelines
Introducción al ML con Scikit-learn

bookDesafío: Creación de un Pipeline

En este desafío, combina todos los pasos de preprocesamiento en una única tubería utilizando el conjunto de datos original penguins.csv.

  1. Elimina las dos filas con datos insuficientes.
  2. Construye una tubería que incluya codificación, imputación y escalado.

Solo es necesario codificar dos columnas, 'sex' e 'island'. Como no deseas codificar todo X, debes utilizar un ColumnTransformer. Después, aplica el SimpleImputer y el StandardScaler a todo X.

Aquí tienes un recordatorio de las funciones make_column_transformer() y make_pipeline() que utilizarás.

Tarea

Swipe to start coding

  1. Importar la función correcta para crear un pipeline.
  2. Crear un ColumnTransformer aplicando el OneHotEncoder solo a las columnas 'sex' e 'island'.
  3. Asegurarse de que todas las demás columnas permanezcan sin cambios.
  4. Crear un pipeline que contenga el ct que acaba de crear, un SimpleImputer que complete los valores faltantes con el valor más frecuente y un StandardScaler como último paso.
  5. Transformar X utilizando el pipe que creó.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookDesafío: Creación de un Pipeline

Desliza para mostrar el menú

En este desafío, combina todos los pasos de preprocesamiento en una única tubería utilizando el conjunto de datos original penguins.csv.

  1. Elimina las dos filas con datos insuficientes.
  2. Construye una tubería que incluya codificación, imputación y escalado.

Solo es necesario codificar dos columnas, 'sex' e 'island'. Como no deseas codificar todo X, debes utilizar un ColumnTransformer. Después, aplica el SimpleImputer y el StandardScaler a todo X.

Aquí tienes un recordatorio de las funciones make_column_transformer() y make_pipeline() que utilizarás.

Tarea

Swipe to start coding

  1. Importar la función correcta para crear un pipeline.
  2. Crear un ColumnTransformer aplicando el OneHotEncoder solo a las columnas 'sex' e 'island'.
  3. Asegurarse de que todas las demás columnas permanezcan sin cambios.
  4. Crear un pipeline que contenga el ct que acaba de crear, un SimpleImputer que complete los valores faltantes con el valor más frecuente y un StandardScaler como último paso.
  5. Transformar X utilizando el pipe que creó.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

close

Awesome!

Completion rate improved to 3.13
Sección 3. Capítulo 4
single

single

some-alt