Seksjon 2. Kapittel 8
single
Utfordring: Koding av Kategoriske Variabler
Sveip for å vise menyen
For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder du bør bruke:
I denne utfordringen arbeider du med penguins dataset (ingen manglende verdier). Alle kategoriske variabler — inkludert målet 'species' — må kodes for bruk i maskinlæring.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Vær oppmerksom på at 'island' og 'sex' er kategoriske egenskaper, mens 'species' er et kategorisk mål.
Oppgave
Swipe to start coding
Du har fått en DataFrame df. Koder alle kategoriske kolonner:
- Importer
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Del dataene i
X(funksjoner) ogy(målvariabel). - Opprett en
OneHotEncoderog bruk den på kolonnene'island'og'sex'iX. - Erstatt de opprinnelige kolonnene med deres kodede versjoner.
- Bruk
LabelEncoderpå kolonnen'species'for å kodey.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 2. Kapittel 8
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår