Avsnitt 2. Kapitel 8
single
Utmaning: Kodning av Kategoriska Variabler
Svep för att visa menyn
För att sammanfatta de tre föregående kapitlen visas här en tabell som anger vilken encoder du bör använda:
I denna utmaning arbetar du med penguins dataset (inga saknade värden). Alla kategoriska variabler — inklusive målet 'species' — måste kodas för användning i maskininlärning.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.
Uppgift
Swipe to start coding
Du har fått en DataFrame df. Koda alla kategoriska kolumner:
- Importera
OneHotEncoderochLabelEncoderfrånsklearn.preprocessing. - Dela upp data i
X(funktioner) ochy(målvariabel). - Skapa en
OneHotEncoderoch applicera den på kolumnerna'island'och'sex'iX. - Ersätt dessa ursprungliga kolumner med deras kodade versioner.
- Använd
LabelEncoderpå kolumnen'species'för att koday.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 2. Kapitel 8
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal