Labelencoder
Свайпніть щоб показати меню
OrdinalEncoder та OneHotEncoder зазвичай використовуються для кодування ознак (змінна X). Однак цільова змінна (y) також може бути категоріальною.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder використовується для кодування цільової змінної, незалежно від того, є вона номінальною чи порядковою.
Моделі машинного навчання не враховують порядок цільової змінної, тому її можна кодувати будь-якими числовими значеннями.
LabelEncoder кодує цільову змінну у числа 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Наведений вище код кодує цільову змінну за допомогою LabelEncoder, а потім використовує метод .inverse_transform(), щоб перетворити її назад до початкового вигляду.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат