Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Codificación de Variables Categóricas | Preprocesamiento de Datos con Scikit-learn
Introducción al ML con Scikit-learn

bookDesafío: Codificación de Variables Categóricas

Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:

En este desafío, se proporciona el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas, incluida la variable objetivo (columna 'species'), deben ser codificadas.

A continuación se muestra un recordatorio de la estructura del conjunto de datos:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.

Tarea

Swipe to start coding

Se proporciona un DataFrame llamado df que contiene datos de pingüinos.
La tarea consiste en codificar todas las características categóricas para que los datos puedan ser utilizados en un modelo de aprendizaje automático.

  1. Importar las clases OneHotEncoder y LabelEncoder desde sklearn.preprocessing.
  2. Separar la matriz de características X y la variable objetivo y del DataFrame.
  3. Crear un objeto OneHotEncoder y aplicarlo a las columnas 'island' y 'sex' en X.
  4. Reemplazar las columnas categóricas originales por las codificadas.
  5. Crear un objeto LabelEncoder y aplicarlo a la columna 'species' para codificar la variable objetivo y.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 8
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

Awesome!

Completion rate improved to 3.13

bookDesafío: Codificación de Variables Categóricas

Desliza para mostrar el menú

Para resumir los tres capítulos anteriores, aquí tienes una tabla que muestra qué codificador deberías utilizar:

En este desafío, se proporciona el conjunto de datos de pingüinos (sin valores faltantes). Todas las características categóricas, incluida la variable objetivo (columna 'species'), deben ser codificadas.

A continuación se muestra un recordatorio de la estructura del conjunto de datos:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Tenga en cuenta que 'island' y 'sex' son características categóricas y 'species' es un objetivo categórico.

Tarea

Swipe to start coding

Se proporciona un DataFrame llamado df que contiene datos de pingüinos.
La tarea consiste en codificar todas las características categóricas para que los datos puedan ser utilizados en un modelo de aprendizaje automático.

  1. Importar las clases OneHotEncoder y LabelEncoder desde sklearn.preprocessing.
  2. Separar la matriz de características X y la variable objetivo y del DataFrame.
  3. Crear un objeto OneHotEncoder y aplicarlo a las columnas 'island' y 'sex' en X.
  4. Reemplazar las columnas categóricas originales por las codificadas.
  5. Crear un objeto LabelEncoder y aplicarlo a la columna 'species' para codificar la variable objetivo y.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 8
single

single

some-alt