Sectie 1. Hoofdstuk 13
single
Uitdaging: Coderen van Categorische Variabelen
Veeg om het menu te tonen
Om de vorige drie hoofdstukken samen te vatten, volgt hier een tabel die aangeeft welke encoder gebruikt moet worden:
In deze uitdaging werk je met de penguins dataset (geen ontbrekende waarden). Alle categorische kenmerken — inclusief de target 'species' — moeten worden gecodeerd voor gebruik in ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.
Taak
Swipe to start coding
Je krijgt een DataFrame df. Encodeer alle categorische kolommen:
- Importeer
OneHotEncoderenLabelEncoderuitsklearn.preprocessing. - Splits de data in
X(features) eny(doelvariabele). - Maak een
OneHotEncoderaan en pas deze toe op de kolommen'island'en'sex'inX. - Vervang deze originele kolommen door hun gecodeerde versies.
- Gebruik
LabelEncoderop de kolom'species'omyte coderen.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 1. Hoofdstuk 13
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.