Label-Encoder
Der OrdinalEncoder
und der OneHotEncoder
werden typischerweise verwendet, um Merkmale (die X
-Variable) zu kodieren. Allerdings kann auch die Zielvariable (y
) kategorisch sein.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
Der LabelEncoder
wird verwendet, um das Ziel zu kodieren, unabhängig davon, ob es nominal oder ordinal ist.
ML-Modelle berücksichtigen die Reihenfolge des Zielwerts nicht, sodass dieser als beliebige numerische Werte codiert werden kann.
LabelEncoder
codiert das Ziel als Zahlen 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Der obige Code codiert das Ziel mithilfe von LabelEncoder
und verwendet anschließend die Methode .inverse_transform()
, um es wieder in die ursprüngliche Darstellung zurückzuwandeln.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain the difference between LabelEncoder and OneHotEncoder?
Why do we use LabelEncoder for the target variable instead of OneHotEncoder?
Can you show how to interpret the encoded values from LabelEncoder?
Awesome!
Completion rate improved to 3.13
Label-Encoder
Swipe um das Menü anzuzeigen
Der OrdinalEncoder
und der OneHotEncoder
werden typischerweise verwendet, um Merkmale (die X
-Variable) zu kodieren. Allerdings kann auch die Zielvariable (y
) kategorisch sein.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
Der LabelEncoder
wird verwendet, um das Ziel zu kodieren, unabhängig davon, ob es nominal oder ordinal ist.
ML-Modelle berücksichtigen die Reihenfolge des Zielwerts nicht, sodass dieser als beliebige numerische Werte codiert werden kann.
LabelEncoder
codiert das Ziel als Zahlen 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Der obige Code codiert das Ziel mithilfe von LabelEncoder
und verwendet anschließend die Methode .inverse_transform()
, um es wieder in die ursprüngliche Darstellung zurückzuwandeln.
Danke für Ihr Feedback!