Utmaning: Kodning av Kategoriska Variabler
För att sammanfatta de tre föregående kapitlen visas här en tabell som anger vilken encoder som bör användas:
I denna utmaning tillhandahålls penguins dataset (utan saknade värden). Alla kategoriska variabler, inklusive målet ('species'-kolumnen), måste kodas.
Här är en påminnelse om datastruktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.
Swipe to start coding
Koda alla kategoriska variabler. Använd one-hot encoding för kolumnerna 'island' och 'sex', och tillämpa en label encoder (eller liknande target encoder) för kolumnen 'species'. Följ dessa steg för att slutföra kodningen.
- Importera
OnehotEncoderochLabelEncoder. - Initiera objektet för kodning av features.
- Koda de kategoriska feature-kolumnerna med hjälp av
feature_enc-objektet. - Initiera objektet för kodning av target.
- Koda target med hjälp av
label_enc-objektet.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Utmaning: Kodning av Kategoriska Variabler
Svep för att visa menyn
För att sammanfatta de tre föregående kapitlen visas här en tabell som anger vilken encoder som bör användas:
I denna utmaning tillhandahålls penguins dataset (utan saknade värden). Alla kategoriska variabler, inklusive målet ('species'-kolumnen), måste kodas.
Här är en påminnelse om datastruktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.
Swipe to start coding
Koda alla kategoriska variabler. Använd one-hot encoding för kolumnerna 'island' och 'sex', och tillämpa en label encoder (eller liknande target encoder) för kolumnen 'species'. Följ dessa steg för att slutföra kodningen.
- Importera
OnehotEncoderochLabelEncoder. - Initiera objektet för kodning av features.
- Koda de kategoriska feature-kolumnerna med hjälp av
feature_enc-objektet. - Initiera objektet för kodning av target.
- Koda target med hjälp av
label_enc-objektet.
Lösning
Tack för dina kommentarer!
single