LabelEncoder
OrdinalEncoder och OneHotEncoder används vanligtvis för att koda funktioner (variabeln X). Dock kan målvariabeln (y) också vara kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder används för att koda målvariabeln, oavsett om den är nominell eller ordinal.
ML-modeller tar inte hänsyn till ordningen på målet, vilket gör att det kan kodas som vilka numeriska värden som helst.
LabelEncoder kodar målet till siffrorna 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovan kodar målet med hjälp av LabelEncoder och använder sedan metoden .inverse_transform() för att konvertera tillbaka till den ursprungliga representationen.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you explain the difference between LabelEncoder and OneHotEncoder?
Why do we use LabelEncoder for the target variable instead of OneHotEncoder?
Can you show how to interpret the encoded values from LabelEncoder?
Awesome!
Completion rate improved to 3.13
LabelEncoder
Svep för att visa menyn
OrdinalEncoder och OneHotEncoder används vanligtvis för att koda funktioner (variabeln X). Dock kan målvariabeln (y) också vara kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder används för att koda målvariabeln, oavsett om den är nominell eller ordinal.
ML-modeller tar inte hänsyn till ordningen på målet, vilket gör att det kan kodas som vilka numeriska värden som helst.
LabelEncoder kodar målet till siffrorna 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovan kodar målet med hjälp av LabelEncoder och använder sedan metoden .inverse_transform() för att konvertera tillbaka till den ursprungliga representationen.
Tack för dina kommentarer!