Codificador de Etiquetas
El OrdinalEncoder
y el OneHotEncoder
se utilizan normalmente para codificar características (la variable X
). Sin embargo, la variable objetivo (y
) también puede ser categórica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
El LabelEncoder
se utiliza para codificar la variable objetivo, sin importar si es nominal u ordinal.
Los modelos de ML no consideran el orden del objetivo, permitiendo que se codifique como cualquier valor numérico.
LabelEncoder
codifica el objetivo en números 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
El código anterior codifica el objetivo utilizando LabelEncoder
y luego utiliza el método .inverse_transform()
para convertirlo nuevamente a su representación original.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Codificador de Etiquetas
Desliza para mostrar el menú
El OrdinalEncoder
y el OneHotEncoder
se utilizan normalmente para codificar características (la variable X
). Sin embargo, la variable objetivo (y
) también puede ser categórica.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
El LabelEncoder
se utiliza para codificar la variable objetivo, sin importar si es nominal u ordinal.
Los modelos de ML no consideran el orden del objetivo, permitiendo que se codifique como cualquier valor numérico.
LabelEncoder
codifica el objetivo en números 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
El código anterior codifica el objetivo utilizando LabelEncoder
y luego utiliza el método .inverse_transform()
para convertirlo nuevamente a su representación original.
¡Gracias por tus comentarios!