Labelencoder
OrdinalEncoder
og OneHotEncoder
bruges typisk til at kode features (variablen X
). Dog kan målvariablen (y
) også være kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
bruges til at kode målvariablen, uanset om den er nominal eller ordinal.
ML-modeller tager ikke hensyn til rækkefølgen af målet, hvilket gør det muligt at kode det som vilkårlige numeriske værdier.
LabelEncoder
koder målet til tallene 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovenfor koder målet ved hjælp af LabelEncoder
og anvender derefter metoden .inverse_transform()
for at konvertere det tilbage til den oprindelige repræsentation.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.13
Labelencoder
Stryg for at vise menuen
OrdinalEncoder
og OneHotEncoder
bruges typisk til at kode features (variablen X
). Dog kan målvariablen (y
) også være kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
bruges til at kode målvariablen, uanset om den er nominal eller ordinal.
ML-modeller tager ikke hensyn til rækkefølgen af målet, hvilket gør det muligt at kode det som vilkårlige numeriske værdier.
LabelEncoder
koder målet til tallene 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovenfor koder målet ved hjælp af LabelEncoder
og anvender derefter metoden .inverse_transform()
for at konvertere det tilbage til den oprindelige repræsentation.
Tak for dine kommentarer!