Utmaning: Kodning av Kategoriska Variabler
För att sammanfatta de tre föregående kapitlen, visas här en tabell som anger vilken encoder som bör användas:
I denna utmaning tillhandahålls penguins dataset (utan saknade värden). Alla kategoriska variabler, inklusive målet ('species'-kolumnen), måste kodas.
Här är en påminnelse om datastruktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.
Swipe to start coding
Du har fått en DataFrame vid namn df som innehåller pingvindata.
Din uppgift är att koda om alla kategoriska variabler så att datan kan användas i en maskininlärningsmodell.
- Importera klasserna
OneHotEncoderochLabelEncoderfrånsklearn.preprocessing. - Separera funktionsmatrisen
Xoch målvariabelnyfrånDataFrame. - Skapa ett
OneHotEncoder-objekt och applicera det på kolumnerna'island'och'sex'iX. - Ersätt de ursprungliga kategoriska kolumnerna med de kodade versionerna.
- Skapa ett
LabelEncoder-objekt och applicera det på kolumnen'species'för att koda målvariabelny.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Utmaning: Kodning av Kategoriska Variabler
Svep för att visa menyn
För att sammanfatta de tre föregående kapitlen, visas här en tabell som anger vilken encoder som bör användas:
I denna utmaning tillhandahålls penguins dataset (utan saknade värden). Alla kategoriska variabler, inklusive målet ('species'-kolumnen), måste kodas.
Här är en påminnelse om datastruktur:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Observera att 'island' och 'sex' är kategoriska funktioner och 'species' är ett kategoriskt mål.
Swipe to start coding
Du har fått en DataFrame vid namn df som innehåller pingvindata.
Din uppgift är att koda om alla kategoriska variabler så att datan kan användas i en maskininlärningsmodell.
- Importera klasserna
OneHotEncoderochLabelEncoderfrånsklearn.preprocessing. - Separera funktionsmatrisen
Xoch målvariabelnyfrånDataFrame. - Skapa ett
OneHotEncoder-objekt och applicera det på kolumnerna'island'och'sex'iX. - Ersätt de ursprungliga kategoriska kolumnerna med de kodade versionerna.
- Skapa ett
LabelEncoder-objekt och applicera det på kolumnen'species'för att koda målvariabelny.
Lösning
Tack för dina kommentarer!
single