Labelencoder
Sveip for å vise menyen
OrdinalEncoder og OneHotEncoder brukes vanligvis til å kode egenskaper (variabelen X). Imidlertid kan målvariabelen (y) også være kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder brukes til å kode målvariabelen, uavhengig av om den er nominell eller ordinal.
ML-modeller tar ikke hensyn til rekkefølgen på målet, noe som gjør at det kan kodes som vilkårlige numeriske verdier.
LabelEncoder koder målet til tallene 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovenfor koder målet ved hjelp av LabelEncoder og bruker deretter metoden .inverse_transform() for å konvertere det tilbake til den opprinnelige representasjonen.
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 1. Kapittel 12
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Seksjon 1. Kapittel 12