Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Kodning af Kategoriske Variabler | Forbehandling af Data med Scikit-learn
Introduktion til Maskinlæring med Python
Sektion 2. Kapitel 8
single

single

bookUdfordring: Kodning af Kategoriske Variabler

Stryg for at vise menuen

For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:

I denne udfordring arbejdes der med penguins dataset (ingen manglende værdier). Alle kategoriske egenskaber — inklusive målet 'species' — skal kodes for brug i maskinlæring.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk mål.

Opgave

Swipe to start coding

Du har fået en DataFrame df. Kod alle kategoriske kolonner:

  1. Importér OneHotEncoder og LabelEncoder fra sklearn.preprocessing.
  2. Opdel dataene i X (features) og y (target).
  3. Opret en OneHotEncoder og anvend den på kolonnerne 'island' og 'sex' i X.
  4. Erstat de originale kolonner med deres kodede versioner.
  5. Brug LabelEncoder på kolonnen 'species' for at kode y.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 8
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

some-alt