Avsnitt 1. Kapitel 13
single
Utmaning: Kodning av Kategoriska Variabler
Svep för att visa menyn
För att sammanfatta de tre föregående kapitlen, här är en tabell som visar vilken encoder du bör använda:
I denna utmaning arbetar du med penguins dataset (inga saknade värden). Alla kategoriska variabler — inklusive målet 'species' — måste kodas för användning i maskininlärning.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.
Uppgift
Swipe to start coding
Du har fått en DataFrame df. Koda alla kategoriska kolumner:
- Importera
OneHotEncoderochLabelEncoderfrånsklearn.preprocessing. - Dela upp data i
X(funktioner) ochy(målvariabel). - Skapa en
OneHotEncoderoch applicera den på kolumnerna'island'och'sex'iX. - Ersätt dessa ursprungliga kolumner med deras kodade versioner.
- Använd
LabelEncoderpå kolumnen'species'för att koday.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 1. Kapitel 13
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal