Uitdaging: Coderen van Categorische Variabelen
Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:
In deze uitdaging werkt u met de penguins dataset (geen ontbrekende waarden). Alle categorische kenmerken — inclusief de target 'species' — moeten worden gecodeerd voor gebruik in ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.
Swipe to start coding
Je krijgt een DataFrame df. Encodeer alle categorische kolommen:
- Importeer
OneHotEncoderenLabelEncoderuitsklearn.preprocessing. - Splits de data in
X(features) eny(doelvariabele). - Maak een
OneHotEncoderaan en pas deze toe op de kolommen'island'en'sex'inX. - Vervang deze originele kolommen door hun gecodeerde versies.
- Gebruik
LabelEncoderop de kolom'species'omyte coderen.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
What are the steps to encode the categorical features and target in this dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
How do I choose which encoder to use for each column in the penguins dataset?
Geweldig!
Completion tarief verbeterd naar 3.13
Uitdaging: Coderen van Categorische Variabelen
Veeg om het menu te tonen
Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:
In deze uitdaging werkt u met de penguins dataset (geen ontbrekende waarden). Alle categorische kenmerken — inclusief de target 'species' — moeten worden gecodeerd voor gebruik in ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.
Swipe to start coding
Je krijgt een DataFrame df. Encodeer alle categorische kolommen:
- Importeer
OneHotEncoderenLabelEncoderuitsklearn.preprocessing. - Splits de data in
X(features) eny(doelvariabele). - Maak een
OneHotEncoderaan en pas deze toe op de kolommen'island'en'sex'inX. - Vervang deze originele kolommen door hun gecodeerde versies.
- Gebruik
LabelEncoderop de kolom'species'omyte coderen.
Oplossing
Bedankt voor je feedback!
single