Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Kodning av Kategoriska Variabler | Förbehandling av Data med Scikit-learn
ML-introduktion Med Scikit-learn

bookUtmaning: Kodning av Kategoriska Variabler

För att sammanfatta de föregående tre kapitlen, här är en tabell som visar vilken encoder du bör använda:

I denna utmaning tillhandahålls penguins dataset (utan saknade värden). Alla kategoriska variabler, inklusive målet ('species'-kolumnen), måste kodas.

Här är en påminnelse om datastruktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Kom ihåg att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.

Uppgift

Swipe to start coding

Koda alla kategoriska variabler. Använd one-hot encoding för kolumnerna 'island' och 'sex', och tillämpa en label encoder (eller liknande target encoder) för kolumnen 'species'. Följ dessa steg för att slutföra kodningen.

  1. Importera OnehotEncoder och LabelEncoder.
  2. Initiera objektet för kodning av features.
  3. Koda de kategoriska feature-kolumnerna med hjälp av feature_enc-objektet.
  4. Initiera objektet för kodning av target.
  5. Koda target med hjälp av label_enc-objektet.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 8
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

Awesome!

Completion rate improved to 3.13

bookUtmaning: Kodning av Kategoriska Variabler

Svep för att visa menyn

För att sammanfatta de föregående tre kapitlen, här är en tabell som visar vilken encoder du bör använda:

I denna utmaning tillhandahålls penguins dataset (utan saknade värden). Alla kategoriska variabler, inklusive målet ('species'-kolumnen), måste kodas.

Här är en påminnelse om datastruktur:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Kom ihåg att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.

Uppgift

Swipe to start coding

Koda alla kategoriska variabler. Använd one-hot encoding för kolumnerna 'island' och 'sex', och tillämpa en label encoder (eller liknande target encoder) för kolumnen 'species'. Följ dessa steg för att slutföra kodningen.

  1. Importera OnehotEncoder och LabelEncoder.
  2. Initiera objektet för kodning av features.
  3. Koda de kategoriska feature-kolumnerna med hjälp av feature_enc-objektet.
  4. Initiera objektet för kodning av target.
  5. Koda target med hjälp av label_enc-objektet.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

close

Awesome!

Completion rate improved to 3.13
Avsnitt 2. Kapitel 8
single

single

some-alt