Labelencoder
De OrdinalEncoder
en OneHotEncoder
worden doorgaans gebruikt om kenmerken (de X
-variabele) te coderen. De doelvariabele (y
) kan echter ook categorisch zijn.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
De LabelEncoder
wordt gebruikt om de doelvariabele te coderen, ongeacht of deze nominaal of ordinaal is.
ML-modellen houden geen rekening met de volgorde van de target, waardoor deze als willekeurige numerieke waarden kan worden gecodeerd.
LabelEncoder
codeert de target naar de getallen 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
De bovenstaande code codeert de target met behulp van LabelEncoder
en gebruikt vervolgens de methode .inverse_transform()
om deze terug te zetten naar de oorspronkelijke representatie.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Labelencoder
Veeg om het menu te tonen
De OrdinalEncoder
en OneHotEncoder
worden doorgaans gebruikt om kenmerken (de X
-variabele) te coderen. De doelvariabele (y
) kan echter ook categorisch zijn.
123456789import pandas as pd # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) print(y) print('All values: ', y.unique())
De LabelEncoder
wordt gebruikt om de doelvariabele te coderen, ongeacht of deze nominaal of ordinaal is.
ML-modellen houden geen rekening met de volgorde van de target, waardoor deze als willekeurige numerieke waarden kan worden gecodeerd.
LabelEncoder
codeert de target naar de getallen 0, 1, ... .
1234567891011121314import pandas as pd from sklearn.preprocessing import LabelEncoder # Load the data and assign X, y variables df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/adult_edu.csv') y = df['income'] # Income is a target in this dataset X = df.drop('income', axis=1) # Initialize a LabelEncoder object and encode the y variable label_enc = LabelEncoder() y = label_enc.fit_transform(y) print(y) # Decode the y variable back y_decoded = label_enc.inverse_transform(y) print(y_decoded)
De bovenstaande code codeert de target met behulp van LabelEncoder
en gebruikt vervolgens de methode .inverse_transform()
om deze terug te zetten naar de oorspronkelijke representatie.
Bedankt voor je feedback!