Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Encodage des Variables Catégorielles | Section
Fondements de l'Apprentissage Automatique
Section 1. Chapitre 13
single

single

bookDéfi : Encodage des Variables Catégorielles

Glissez pour afficher le menu

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, vous travaillez avec le jeu de données des manchots (sans valeurs manquantes). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Glissez pour commencer à coder

Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :

  1. Importez OneHotEncoder et LabelEncoder depuis sklearn.preprocessing.
  2. Séparez les données en X (caractéristiques) et y (cible).
  3. Créez un OneHotEncoder et appliquez-le aux colonnes 'island' et 'sex' dans X.
  4. Remplacez ces colonnes d'origine par leurs versions encodées.
  5. Utilisez LabelEncoder sur la colonne 'species' pour encoder y.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 13
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

some-alt