Glissez pour afficher le menu

Les OrdinalEncoder et OneHotEncoder sont généralement utilisés pour encoder les caractéristiques (la variable X). Cependant, la variable cible (y) peut également être catégorielle.


              123456789
            
import pandas as pd

# Load the data and assign X, y variables
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv')
y = df['income'] # Income is a target in this dataset
X = df.drop('income', axis=1)

print(y)
print('All values: ', y.unique())

Le LabelEncoder est utilisé pour encoder la cible, qu'elle soit nominale ou ordinale.

Les modèles d'apprentissage automatique ne tiennent pas compte de l'ordre de la cible, ce qui permet de l'encoder avec n'importe quelles valeurs numériques. LabelEncoder encode la cible en nombres 0, 1, ... .


              1234567891011121314
            
import pandas as pd
from sklearn.preprocessing import LabelEncoder

# Load the data and assign X, y variables
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv')
y = df['income'] # Income is a target in this dataset
X = df.drop('income', axis=1)
# Initialize a LabelEncoder object and encode the y variable
label_enc = LabelEncoder()
y = label_enc.fit_transform(y)
print(y)
# Decode the y variable back
y_decoded = label_enc.inverse_transform(y)
print(y_decoded)

Le code ci-dessus encode la cible à l'aide de LabelEncoder puis utilise la méthode .inverse_transform() pour la reconvertir dans sa représentation d'origine.

Tout était clair ?

Merci pour vos commentaires !

Section 2. Chapitre 7

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Encodeur d'étiquettes