Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Encodage des Variables Catégorielles | Prétraitement des Données avec Scikit-learn
Introduction à l'Apprentissage Automatique avec Python

bookDéfi : Encodage des Variables Catégorielles

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, vous travaillez avec le jeu de données des manchots (aucune valeur manquante). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :

  1. Importez OneHotEncoder et LabelEncoder depuis sklearn.preprocessing.
  2. Séparez les données en X (caractéristiques) et y (cible).
  3. Créez un OneHotEncoder et appliquez-le aux colonnes 'island' et 'sex' de X.
  4. Remplacez ces colonnes d'origine par leurs versions encodées.
  5. Utilisez LabelEncoder sur la colonne 'species' pour encoder y.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

What are the steps to encode the categorical features and target in this dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

How do I choose which encoder to use for each column in the penguins dataset?

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Encodage des Variables Catégorielles

Glissez pour afficher le menu

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, vous travaillez avec le jeu de données des manchots (aucune valeur manquante). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :

  1. Importez OneHotEncoder et LabelEncoder depuis sklearn.preprocessing.
  2. Séparez les données en X (caractéristiques) et y (cible).
  3. Créez un OneHotEncoder et appliquez-le aux colonnes 'island' et 'sex' de X.
  4. Remplacez ces colonnes d'origine par leurs versions encodées.
  5. Utilisez LabelEncoder sur la colonne 'species' pour encoder y.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

some-alt