Sektion 2. Kapitel 8
single
Udfordring: Kodning af Kategoriske Variabler
Stryg for at vise menuen
For at opsummere de foregående tre kapitler, vises her en tabel, der angiver, hvilken encoder der bør anvendes:
I denne udfordring arbejdes der med penguins dataset (ingen manglende værdier). Alle kategoriske egenskaber — inklusive målet 'species' — skal kodes for brug i maskinlæring.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk mål.
Opgave
Swipe to start coding
Du har fået en DataFrame df. Kod alle kategoriske kolonner:
- Importér
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Opdel dataene i
X(features) ogy(target). - Opret en
OneHotEncoderog anvend den på kolonnerne'island'og'sex'iX. - Erstat de originale kolonner med deres kodede versioner.
- Brug
LabelEncoderpå kolonnen'species'for at kodey.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 2. Kapitel 8
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat