Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Challenge: Encoding Categorical Variables | Preprocessing Data with Scikit-learn
ML Introduction with scikit-learn

Svep för att visa menyn

book
Challenge: Encoding Categorical Variables

To summarize the previous three chapters, here is a table showing what encoder you should use:

In this challenge, you have the penguins dataset file (with no missing values). You need to deal with all the categorical values, including the target ('species' column).

Here is the reminder of the data you will work with:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Keep in mind that 'island' and 'sex' are categorical features and 'species' is a categorical target.

Uppgift

Swipe to start coding

Encode all the categorical values. For this, you need to choose the correct encoder for the 'island', and 'sex' columns and follow the steps.

  1. Import OnehotEncoder and LabelEncoder.
  2. Initialize the features encoder object.
  3. Encode the categorical feature columns using the feature_enc object.
  4. Initialize the target encoder object.
  5. Encode the target using the label_enc object.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 8
Vi beklagar att något gick fel. Vad hände?

Fråga AI

expand
ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

book
Challenge: Encoding Categorical Variables

To summarize the previous three chapters, here is a table showing what encoder you should use:

In this challenge, you have the penguins dataset file (with no missing values). You need to deal with all the categorical values, including the target ('species' column).

Here is the reminder of the data you will work with:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Keep in mind that 'island' and 'sex' are categorical features and 'species' is a categorical target.

Uppgift

Swipe to start coding

Encode all the categorical values. For this, you need to choose the correct encoder for the 'island', and 'sex' columns and follow the steps.

  1. Import OnehotEncoder and LabelEncoder.
  2. Initialize the features encoder object.
  3. Encode the categorical feature columns using the feature_enc object.
  4. Initialize the target encoder object.
  5. Encode the target using the label_enc object.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 8
Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Vi beklagar att något gick fel. Vad hände?
some-alt