Aprende Labelencoder | Preprocesamiento de Datos con Scikit-learn

Desliza para mostrar el menú

El OrdinalEncoder y el OneHotEncoder se utilizan normalmente para codificar características (la variable X). Sin embargo, la variable objetivo (y) también puede ser categórica.


              123456789
            
import pandas as pd

# Load the data and assign X, y variables
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv')
y = df['income'] # Income is a target in this dataset
X = df.drop('income', axis=1)

print(y)
print('All values: ', y.unique())

El LabelEncoder se utiliza para codificar la variable objetivo, sin importar si es nominal u ordinal.

Los modelos de aprendizaje automático no consideran el orden del objetivo, permitiendo que se codifique como cualquier valor numérico. LabelEncoder codifica el objetivo en números 0, 1, ... .


              1234567891011121314
            
import pandas as pd
from sklearn.preprocessing import LabelEncoder

# Load the data and assign X, y variables
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv')
y = df['income'] # Income is a target in this dataset
X = df.drop('income', axis=1)
# Initialize a LabelEncoder object and encode the y variable
label_enc = LabelEncoder()
y = label_enc.fit_transform(y)
print(y)
# Decode the y variable back
y_decoded = label_enc.inverse_transform(y)
print(y_decoded)

El código anterior codifica el objetivo utilizando LabelEncoder y luego emplea el método .inverse_transform() para convertirlo nuevamente a su representación original.

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 2. Capítulo 7

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 2. Capítulo 7