Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Challenge: Kodning av Kategoriska Variabler | Förbehandling av Data med Scikit-learn
Introduktion till maskininlärning med Python
Avsnitt 2. Kapitel 8
single

single

Challenge: Kodning av Kategoriska Variabler

Svep för att visa menyn

För att sammanfatta de tre föregående kapitlen, här är en tabell som visar vilken encoder du bör använda:

Ordinal kodning
One-hot-kodning

I denna utmaning arbetar du med penguins dataset (inga saknade värden). Alla kategoriska variabler — inklusive målet 'species' — måste kodas för användning i maskininlärning.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())

Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.

Uppgift

Svep för att börja koda

Du har fått en DataFrame df. Koda alla kategoriska kolumner:

  1. Importera OneHotEncoder och LabelEncoder från sklearn.preprocessing.
  2. Dela upp data i X (funktioner) och y (målvariabel).
  3. Skapa en OneHotEncoder och applicera den på kolumnerna 'island' och 'sex' i X.
  4. Ersätt de ursprungliga kolumnerna med deras kodade versioner.
  5. Använd LabelEncoder på kolumnen 'species' för att koda y.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 8
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

some-alt