Encodeur d'Étiquettes
L'OrdinalEncoder
et l'OneHotEncoder
sont généralement utilisés pour encoder les caractéristiques (la variable X
). Cependant, la variable cible (y
) peut également être catégorielle.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
Le LabelEncoder
est utilisé pour encoder la cible, qu'elle soit nominale ou ordinale.
Les modèles d'apprentissage automatique ne prennent pas en compte l'ordre de la cible, ce qui permet de l'encoder sous n'importe quelle valeur numérique.
LabelEncoder
encode la cible en nombres 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Le code ci-dessus encode la cible à l'aide de LabelEncoder
puis utilise la méthode .inverse_transform()
pour la reconvertir dans sa représentation d'origine.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.13
Encodeur d'Étiquettes
Glissez pour afficher le menu
L'OrdinalEncoder
et l'OneHotEncoder
sont généralement utilisés pour encoder les caractéristiques (la variable X
). Cependant, la variable cible (y
) peut également être catégorielle.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
Le LabelEncoder
est utilisé pour encoder la cible, qu'elle soit nominale ou ordinale.
Les modèles d'apprentissage automatique ne prennent pas en compte l'ordre de la cible, ce qui permet de l'encoder sous n'importe quelle valeur numérique.
LabelEncoder
encode la cible en nombres 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Le code ci-dessus encode la cible à l'aide de LabelEncoder
puis utilise la méthode .inverse_transform()
pour la reconvertir dans sa représentation d'origine.
Merci pour vos commentaires !