Desafío: Creación de un Pipeline
En este desafío, combina todos los pasos de preprocesamiento en una única tubería utilizando el conjunto de datos original penguins.csv
.
- Elimina las dos filas con datos insuficientes.
- Construye una tubería que incluya codificación, imputación y escalado.
Solo es necesario codificar dos columnas, 'sex'
e 'island'
. Como no deseas codificar todo X
, debes utilizar un ColumnTransformer
. Después, aplica el SimpleImputer
y el StandardScaler
a todo X
.
Aquí tienes un recordatorio de las funciones make_column_transformer()
y make_pipeline()
que utilizarás.
Swipe to start coding
- Importar la función correcta para crear un pipeline.
- Crear un
ColumnTransformer
aplicando elOneHotEncoder
solo a las columnas'sex'
e'island'
. - Asegurarse de que todas las demás columnas permanezcan sin cambios.
- Crear un pipeline que contenga el
ct
que acaba de crear, unSimpleImputer
que complete los valores faltantes con el valor más frecuente y unStandardScaler
como último paso. - Transformar
X
utilizando elpipe
que creó.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you show me how to build the pipeline step by step?
What should I use for encoding the 'sex' and 'island' columns?
How do I remove the two rows with insufficient data?
Awesome!
Completion rate improved to 3.13
Desafío: Creación de un Pipeline
Desliza para mostrar el menú
En este desafío, combina todos los pasos de preprocesamiento en una única tubería utilizando el conjunto de datos original penguins.csv
.
- Elimina las dos filas con datos insuficientes.
- Construye una tubería que incluya codificación, imputación y escalado.
Solo es necesario codificar dos columnas, 'sex'
e 'island'
. Como no deseas codificar todo X
, debes utilizar un ColumnTransformer
. Después, aplica el SimpleImputer
y el StandardScaler
a todo X
.
Aquí tienes un recordatorio de las funciones make_column_transformer()
y make_pipeline()
que utilizarás.
Swipe to start coding
- Importar la función correcta para crear un pipeline.
- Crear un
ColumnTransformer
aplicando elOneHotEncoder
solo a las columnas'sex'
e'island'
. - Asegurarse de que todas las demás columnas permanezcan sin cambios.
- Crear un pipeline que contenga el
ct
que acaba de crear, unSimpleImputer
que complete los valores faltantes con el valor más frecuente y unStandardScaler
como último paso. - Transformar
X
utilizando elpipe
que creó.
Solución
¡Gracias por tus comentarios!
Awesome!
Completion rate improved to 3.13single