Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Coderen van Categorische Variabelen | Gegevens Preprocessen Met Scikit-learn
Introductie tot Machine Learning met Python

bookUitdaging: Coderen van Categorische Variabelen

Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:

In deze uitdaging wordt de penguins dataset (zonder ontbrekende waarden) aangeboden. Alle categorische kenmerken, inclusief de target ('species' kolom), moeten worden gecodeerd.

Hier volgt een herinnering aan de structuur van de dataset:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.

Taak

Swipe to start coding

Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Je taak is om alle categorische kenmerken te coderen zodat de gegevens gebruikt kunnen worden in een machine learning-model.

  1. Importeer de klassen OneHotEncoder en LabelEncoder uit sklearn.preprocessing.
  2. Scheid de featurematrix X en de doelvariabele y uit het DataFrame.
  3. Maak een OneHotEncoder-object aan en pas dit toe op de kolommen 'island' en 'sex' in X.
  4. Vervang de originele categorische kolommen door de gecodeerde kolommen.
  5. Maak een LabelEncoder-object aan en pas dit toe op de kolom 'species' om de doelvariabele y te coderen.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 8
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 3.13

bookUitdaging: Coderen van Categorische Variabelen

Veeg om het menu te tonen

Ter samenvatting van de vorige drie hoofdstukken, volgt hier een tabel die aangeeft welke encoder u dient te gebruiken:

In deze uitdaging wordt de penguins dataset (zonder ontbrekende waarden) aangeboden. Alle categorische kenmerken, inclusief de target ('species' kolom), moeten worden gecodeerd.

Hier volgt een herinnering aan de structuur van de dataset:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Houd er rekening mee dat 'island' en 'sex' categorische kenmerken zijn en 'species' een categorisch doel is.

Taak

Swipe to start coding

Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Je taak is om alle categorische kenmerken te coderen zodat de gegevens gebruikt kunnen worden in een machine learning-model.

  1. Importeer de klassen OneHotEncoder en LabelEncoder uit sklearn.preprocessing.
  2. Scheid de featurematrix X en de doelvariabele y uit het DataFrame.
  3. Maak een OneHotEncoder-object aan en pas dit toe op de kolommen 'island' en 'sex' in X.
  4. Vervang de originele categorische kolommen door de gecodeerde kolommen.
  5. Maak een LabelEncoder-object aan en pas dit toe op de kolom 'species' om de doelvariabele y te coderen.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 8
single

single

some-alt