Uitdaging: Coderen van Categorische Variabelen
Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:
In deze uitdaging wordt de penguins dataset (zonder ontbrekende waarden) aangeboden. Alle categorische kenmerken, inclusief de target ('species' kolom), moeten worden gecodeerd.
Hier volgt een herinnering aan de structuur van de dataset:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.
Swipe to start coding
Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Je taak is om alle categorische kenmerken te coderen zodat de gegevens gebruikt kunnen worden in een machine learning-model.
- Importeer de klassen
OneHotEncoderenLabelEncoderuitsklearn.preprocessing. - Scheid de featurematrix
Xen de doelvariabeleyuit hetDataFrame. - Maak een
OneHotEncoder-object aan en pas dit toe op de kolommen'island'en'sex'inX. - Vervang de originele categorische kolommen door de gecodeerde kolommen.
- Maak een
LabelEncoder-object aan en pas dit toe op de kolom'species'om de doelvariabeleyte coderen.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Uitdaging: Coderen van Categorische Variabelen
Veeg om het menu te tonen
Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:
In deze uitdaging wordt de penguins dataset (zonder ontbrekende waarden) aangeboden. Alle categorische kenmerken, inclusief de target ('species' kolom), moeten worden gecodeerd.
Hier volgt een herinnering aan de structuur van de dataset:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.
Swipe to start coding
Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Je taak is om alle categorische kenmerken te coderen zodat de gegevens gebruikt kunnen worden in een machine learning-model.
- Importeer de klassen
OneHotEncoderenLabelEncoderuitsklearn.preprocessing. - Scheid de featurematrix
Xen de doelvariabeleyuit hetDataFrame. - Maak een
OneHotEncoder-object aan en pas dit toe op de kolommen'island'en'sex'inX. - Vervang de originele categorische kolommen door de gecodeerde kolommen.
- Maak een
LabelEncoder-object aan en pas dit toe op de kolom'species'om de doelvariabeleyte coderen.
Oplossing
Bedankt voor je feedback!
single