Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Codificación de Variables Categóricas | Preprocesamiento de Datos con Scikit-learn
Quizzes & Challenges
Quizzes
Challenges
/
Introducción al Aprendizaje Automático con Python

bookDesafío: Codificación de Variables Categóricas

Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador debes utilizar:

En este desafío, se trabaja con el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas —incluyendo el objetivo 'species'— deben ser codificadas para su uso en aprendizaje automático.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.

Tarea

Swipe to start coding

Se proporciona un DataFrame llamado df. Codifica todas las columnas categóricas:

  1. Importar OneHotEncoder y LabelEncoder desde sklearn.preprocessing.
  2. Dividir los datos en X (características) e y (objetivo).
  3. Crear un OneHotEncoder y aplicarlo a las columnas 'island' y 'sex' en X.
  4. Reemplazar esas columnas originales por sus versiones codificadas.
  5. Utilizar LabelEncoder en la columna 'species' para codificar y.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 8
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

What are the steps to encode the categorical features and target in this dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

How do I choose which encoder to use for each column in the penguins dataset?

close

Awesome!

Completion rate improved to 3.13

bookDesafío: Codificación de Variables Categóricas

Desliza para mostrar el menú

Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador debes utilizar:

En este desafío, se trabaja con el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas —incluyendo el objetivo 'species'— deben ser codificadas para su uso en aprendizaje automático.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.

Tarea

Swipe to start coding

Se proporciona un DataFrame llamado df. Codifica todas las columnas categóricas:

  1. Importar OneHotEncoder y LabelEncoder desde sklearn.preprocessing.
  2. Dividir los datos en X (características) e y (objetivo).
  3. Crear un OneHotEncoder y aplicarlo a las columnas 'island' y 'sex' en X.
  4. Reemplazar esas columnas originales por sus versiones codificadas.
  5. Utilizar LabelEncoder en la columna 'species' para codificar y.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 8
single

single

some-alt