Desafío: Codificación de Variables Categóricas
Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador debes utilizar:
En este desafío, se trabaja con el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas —incluyendo el objetivo 'species'— deben ser codificadas para su uso en aprendizaje automático.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.
Swipe to start coding
Se proporciona un DataFrame llamado df. Codifica todas las columnas categóricas:
- Importar
OneHotEncoderyLabelEncoderdesdesklearn.preprocessing. - Dividir los datos en
X(características) ey(objetivo). - Crear un
OneHotEncodery aplicarlo a las columnas'island'y'sex'enX. - Reemplazar esas columnas originales por sus versiones codificadas.
- Utilizar
LabelEncoderen la columna'species'para codificary.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
What are the steps to encode the categorical features and target in this dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
How do I choose which encoder to use for each column in the penguins dataset?
Awesome!
Completion rate improved to 3.13
Desafío: Codificación de Variables Categóricas
Desliza para mostrar el menú
Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador debes utilizar:
En este desafío, se trabaja con el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas —incluyendo el objetivo 'species'— deben ser codificadas para su uso en aprendizaje automático.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.
Swipe to start coding
Se proporciona un DataFrame llamado df. Codifica todas las columnas categóricas:
- Importar
OneHotEncoderyLabelEncoderdesdesklearn.preprocessing. - Dividir los datos en
X(características) ey(objetivo). - Crear un
OneHotEncodery aplicarlo a las columnas'island'y'sex'enX. - Reemplazar esas columnas originales por sus versiones codificadas.
- Utilizar
LabelEncoderen la columna'species'para codificary.
Solución
¡Gracias por tus comentarios!
single