Codificador de Etiquetas
El OrdinalEncoder
y el OneHotEncoder
se utilizan normalmente para codificar características (la variable X
). Sin embargo, la variable objetivo (y
) también puede ser categórica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
El LabelEncoder
se utiliza para codificar la variable objetivo, independientemente de si es nominal u ordinal.
Los modelos de ML no consideran el orden del objetivo, permitiendo que se codifique como cualquier valor numérico.
LabelEncoder
codifica el objetivo en números 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
El código anterior codifica el objetivo utilizando LabelEncoder
y luego utiliza el método .inverse_transform()
para convertirlo nuevamente a su representación original.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you explain the difference between LabelEncoder and OneHotEncoder?
Why do we use LabelEncoder for the target variable instead of OneHotEncoder?
Can you show how to interpret the encoded values from LabelEncoder?
Awesome!
Completion rate improved to 3.13
Codificador de Etiquetas
Desliza para mostrar el menú
El OrdinalEncoder
y el OneHotEncoder
se utilizan normalmente para codificar características (la variable X
). Sin embargo, la variable objetivo (y
) también puede ser categórica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
El LabelEncoder
se utiliza para codificar la variable objetivo, independientemente de si es nominal u ordinal.
Los modelos de ML no consideran el orden del objetivo, permitiendo que se codifique como cualquier valor numérico.
LabelEncoder
codifica el objetivo en números 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
El código anterior codifica el objetivo utilizando LabelEncoder
y luego utiliza el método .inverse_transform()
para convertirlo nuevamente a su representación original.
¡Gracias por tus comentarios!