Sektion 2. Kapitel 8
single
Challenge: Kodning af Kategoriske Variabler
Stryg for at vise menuen
For at opsummere de foregående tre kapitler, er her en tabel, der viser, hvilken encoder du bør bruge:
I denne udfordring arbejder du med penguins dataset (ingen manglende værdier). Alle kategoriske egenskaber — inklusive målet 'species' — skal kodes til brug i maskinlæring.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Bemærk, at 'island' og 'sex' er kategoriske features, og 'species' er et kategorisk target.
Opgave
Swipe to start coding
Du har fået en DataFrame df. Kod alle kategoriske kolonner:
- Importér
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Opdel dataene i
X(features) ogy(target). - Opret en
OneHotEncoderog anvend den på kolonnerne'island'og'sex'iX. - Erstat de originale kolonner med deres kodede versioner.
- Brug
LabelEncoderpå kolonnen'species'for at kodey.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 2. Kapitel 8
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat