Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Kodning av Kategoriska Variabler | Förbehandling av Data med Scikit-learn
Quizzes & Challenges
Quizzes
Challenges
/
Introduktion till maskininlärning med Python

bookUtmaning: Kodning av Kategoriska Variabler

För att sammanfatta de tre föregående kapitlen visas här en tabell som anger vilken encoder du bör använda:

I denna utmaning arbetar du med penguins dataset (inga saknade värden). Alla kategoriska variabler — inklusive målet 'species' — måste kodas för användning i maskininlärning.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.

Uppgift

Swipe to start coding

Du har fått en DataFrame df. Koda alla kategoriska kolumner:

  1. Importera OneHotEncoder och LabelEncoder från sklearn.preprocessing.
  2. Dela upp data i X (funktioner) och y (målvariabel).
  3. Skapa en OneHotEncoder och applicera den på kolumnerna 'island' och 'sex' i X.
  4. Ersätt dessa ursprungliga kolumner med deras kodade versioner.
  5. Använd LabelEncoder på kolumnen 'species' för att koda y.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 8
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

Awesome!

Completion rate improved to 3.13

bookUtmaning: Kodning av Kategoriska Variabler

Svep för att visa menyn

För att sammanfatta de tre föregående kapitlen visas här en tabell som anger vilken encoder du bör använda:

I denna utmaning arbetar du med penguins dataset (inga saknade värden). Alla kategoriska variabler — inklusive målet 'species' — måste kodas för användning i maskininlärning.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.

Uppgift

Swipe to start coding

Du har fått en DataFrame df. Koda alla kategoriska kolumner:

  1. Importera OneHotEncoder och LabelEncoder från sklearn.preprocessing.
  2. Dela upp data i X (funktioner) och y (målvariabel).
  3. Skapa en OneHotEncoder och applicera den på kolumnerna 'island' och 'sex' i X.
  4. Ersätt dessa ursprungliga kolumner med deras kodade versioner.
  5. Använd LabelEncoder på kolumnen 'species' för att koda y.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 8
single

single

some-alt