Utfordring: Koding av Kategoriske Variabler
For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder som bør brukes:
I denne utfordringen er penguins dataset (uten manglende verdier) gitt. Alle kategoriske variabler, inkludert målet ('species'-kolonnen), må kodes.
Her er en påminnelse om datasettets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Husk at 'island' og 'sex' er kategoriske funksjoner, og 'species' er et kategorisk mål.
Swipe to start coding
Du har fått en DataFrame kalt df som inneholder pingvindata.
Din oppgave er å kode alle kategoriske variabler slik at dataene kan brukes i en maskinlæringsmodell.
- Importer klassene
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Skill ut feature-matrisen
Xog målvariabelenyfraDataFrame. - Opprett et
OneHotEncoder-objekt og bruk det på kolonnene'island'og'sex'iX. - Erstatt de opprinnelige kategoriske kolonnene med de kodede variantene.
- Opprett et
LabelEncoder-objekt og bruk det på kolonnen'species'for å kode målvariabeleny.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.13
Utfordring: Koding av Kategoriske Variabler
Sveip for å vise menyen
For å oppsummere de tre foregående kapitlene, viser denne tabellen hvilken encoder som bør brukes:
I denne utfordringen er penguins dataset (uten manglende verdier) gitt. Alle kategoriske variabler, inkludert målet ('species'-kolonnen), må kodes.
Her er en påminnelse om datasettets struktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Husk at 'island' og 'sex' er kategoriske funksjoner, og 'species' er et kategorisk mål.
Swipe to start coding
Du har fått en DataFrame kalt df som inneholder pingvindata.
Din oppgave er å kode alle kategoriske variabler slik at dataene kan brukes i en maskinlæringsmodell.
- Importer klassene
OneHotEncoderogLabelEncoderfrasklearn.preprocessing. - Skill ut feature-matrisen
Xog målvariabelenyfraDataFrame. - Opprett et
OneHotEncoder-objekt og bruk det på kolonnene'island'og'sex'iX. - Erstatt de opprinnelige kategoriske kolonnene med de kodede variantene.
- Opprett et
LabelEncoder-objekt og bruk det på kolonnen'species'for å kode målvariabeleny.
Løsning
Takk for tilbakemeldingene dine!
single