LabelEncoder
OrdinalEncoder
og OneHotEncoder
brukes vanligvis til å kode funksjoner (variabelen X
). Imidlertid kan målvariabelen (y
) også være kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
brukes til å kode målvariabelen, uavhengig av om den er nominell eller ordinal.
ML-modeller tar ikke hensyn til rekkefølgen på målet, noe som gjør at det kan kodes som vilkårlige numeriske verdier.
LabelEncoder
koder målet til tallene 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovenfor koder målet ved hjelp av LabelEncoder
og bruker deretter metoden .inverse_transform()
for å konvertere det tilbake til den opprinnelige representasjonen.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.13
LabelEncoder
Sveip for å vise menyen
OrdinalEncoder
og OneHotEncoder
brukes vanligvis til å kode funksjoner (variabelen X
). Imidlertid kan målvariabelen (y
) også være kategorisk.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
LabelEncoder
brukes til å kode målvariabelen, uavhengig av om den er nominell eller ordinal.
ML-modeller tar ikke hensyn til rekkefølgen på målet, noe som gjør at det kan kodes som vilkårlige numeriske verdier.
LabelEncoder
koder målet til tallene 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
Koden ovenfor koder målet ved hjelp av LabelEncoder
og bruker deretter metoden .inverse_transform()
for å konvertere det tilbake til den opprinnelige representasjonen.
Takk for tilbakemeldingene dine!