Seksjon 2. Kapittel 8
single
Utfordring: Koding av Kategoriske Variabler
Sveip for å vise menyen
For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder du bør bruke:
I denne utfordringen arbeider du med penguins dataset (ingen manglende verdier). Alle kategoriske variabler — inkludert målet 'species' — må kodes for bruk i maskinlæring.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Vær oppmerksom på at 'island' og 'sex' er kategoriske egenskaper, mens 'species' er et kategorisk mål.
Oppgave
Sveip for å begynne å kode
Du har fått en DataFrame df. Koder alle kategoriske kolonner:
- Importer
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Del dataene i
X(funksjoner) ogy(målvariabel). - Opprett en
OneHotEncoderog bruk den på kolonnene'island'og'sex'iX. - Erstatt de opprinnelige kolonnene med deres kodede versjoner.
- Bruk
LabelEncoderpå kolonnen'species'for å kodey.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 2. Kapittel 8
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår