Desafío: Codificación de Variables Categóricas
Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:
En este desafío, se proporciona el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas, incluida la variable objetivo (columna 'species'
), deben ser codificadas.
A continuación se muestra un recordatorio de la estructura del conjunto de datos:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Tenga en cuenta que 'island'
y 'sex'
son características categóricas y 'species'
es un objetivo categórico.
Swipe to start coding
Codificación de todas las características categóricas. Utilizar one-hot encoding para las columnas 'island'
y 'sex'
, y aplicar un label encoder (o un codificador de destino similar) para la columna 'species'
. Siga estos pasos para completar la codificación.
- Importar
OnehotEncoder
yLabelEncoder
. - Inicializar el objeto codificador de características.
- Codificar las columnas de características categóricas utilizando el objeto
feature_enc
. - Inicializar el objeto codificador de destino.
- Codificar el objetivo utilizando el objeto
label_enc
.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Desafío: Codificación de Variables Categóricas
Desliza para mostrar el menú
Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:
En este desafío, se proporciona el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas, incluida la variable objetivo (columna 'species'
), deben ser codificadas.
A continuación se muestra un recordatorio de la estructura del conjunto de datos:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Tenga en cuenta que 'island'
y 'sex'
son características categóricas y 'species'
es un objetivo categórico.
Swipe to start coding
Codificación de todas las características categóricas. Utilizar one-hot encoding para las columnas 'island'
y 'sex'
, y aplicar un label encoder (o un codificador de destino similar) para la columna 'species'
. Siga estos pasos para completar la codificación.
- Importar
OnehotEncoder
yLabelEncoder
. - Inicializar el objeto codificador de características.
- Codificar las columnas de características categóricas utilizando el objeto
feature_enc
. - Inicializar el objeto codificador de destino.
- Codificar el objetivo utilizando el objeto
label_enc
.
Solución
¡Gracias por tus comentarios!
Awesome!
Completion rate improved to 3.13single