Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Encodage des Variables Catégorielles | Prétraitement des Données avec Scikit-learn
Introduction au ML Avec Scikit-Learn

bookDéfi : Encodage des Variables Catégorielles

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'), doivent être encodées.

Voici un rappel de la structure du jeu de données :

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Encoder toutes les variables catégorielles. Utiliser l'encodage one-hot pour les colonnes 'island' et 'sex', et appliquer un label encoder (ou un encodeur de cible similaire) pour la colonne 'species'. Suivre ces étapes pour réaliser l'encodage.

  1. Importer OnehotEncoder et LabelEncoder.
  2. Initialiser l'objet d'encodage des variables explicatives.
  3. Encoder les colonnes de variables catégorielles à l'aide de l'objet feature_enc.
  4. Initialiser l'objet d'encodage de la cible.
  5. Encoder la cible à l'aide de l'objet label_enc.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Encodage des Variables Catégorielles

Glissez pour afficher le menu

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'), doivent être encodées.

Voici un rappel de la structure du jeu de données :

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Encoder toutes les variables catégorielles. Utiliser l'encodage one-hot pour les colonnes 'island' et 'sex', et appliquer un label encoder (ou un encodeur de cible similaire) pour la colonne 'species'. Suivre ces étapes pour réaliser l'encodage.

  1. Importer OnehotEncoder et LabelEncoder.
  2. Initialiser l'objet d'encodage des variables explicatives.
  3. Encoder les colonnes de variables catégorielles à l'aide de l'objet feature_enc.
  4. Initialiser l'objet d'encodage de la cible.
  5. Encoder la cible à l'aide de l'objet label_enc.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

close

Awesome!

Completion rate improved to 3.13
Section 2. Chapitre 8
single

single

some-alt