Desafío: Codificación de Variables Categóricas
Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:
En este desafío, se proporciona el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas, incluida la variable objetivo (columna 'species'), deben ser codificadas.
A continuación se muestra un recordatorio de la estructura del conjunto de datos:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.
Swipe to start coding
Se proporciona un DataFrame llamado df que contiene datos de pingüinos.
La tarea consiste en codificar todas las características categóricas para que los datos puedan ser utilizados en un modelo de aprendizaje automático.
- Importar las clases
OneHotEncoderyLabelEncoderdesdesklearn.preprocessing. - Separar la matriz de características
Xy la variable objetivoydelDataFrame. - Crear un objeto
OneHotEncodery aplicarlo a las columnas'island'y'sex'enX. - Reemplazar las columnas categóricas originales por las codificadas.
- Crear un objeto
LabelEncodery aplicarlo a la columna'species'para codificar la variable objetivoy.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Desafío: Codificación de Variables Categóricas
Desliza para mostrar el menú
Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:
En este desafío, se proporciona el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas, incluida la variable objetivo (columna 'species'), deben ser codificadas.
A continuación se muestra un recordatorio de la estructura del conjunto de datos:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.
Swipe to start coding
Se proporciona un DataFrame llamado df que contiene datos de pingüinos.
La tarea consiste en codificar todas las características categóricas para que los datos puedan ser utilizados en un modelo de aprendizaje automático.
- Importar las clases
OneHotEncoderyLabelEncoderdesdesklearn.preprocessing. - Separar la matriz de características
Xy la variable objetivoydelDataFrame. - Crear un objeto
OneHotEncodery aplicarlo a las columnas'island'y'sex'enX. - Reemplazar las columnas categóricas originales por las codificadas.
- Crear un objeto
LabelEncodery aplicarlo a la columna'species'para codificar la variable objetivoy.
Solución
¡Gracias por tus comentarios!
single