Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Encodage des Variables Catégorielles | Prétraitement des Données avec Scikit-learn
Introduction au ML avec Scikit-learn

bookDéfi : Encodage des Variables Catégorielles

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'), doivent être encodées.

Voici un rappel de la structure du jeu de données :

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé df contenant des données sur les manchots.
Votre tâche consiste à encoder toutes les variables catégorielles afin que les données puissent être utilisées dans un modèle d'apprentissage automatique.

  1. Importez les classes OneHotEncoder et LabelEncoder depuis sklearn.preprocessing.
  2. Séparez la matrice de caractéristiques X et la variable cible y à partir du DataFrame.
  3. Créez un objet OneHotEncoder et appliquez-le aux colonnes 'island' et 'sex' de X.
  4. Remplacez les colonnes catégorielles d'origine par les colonnes encodées.
  5. Créez un objet LabelEncoder et appliquez-le à la colonne 'species' pour encoder la variable cible y.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Encodage des Variables Catégorielles

Glissez pour afficher le menu

Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :

Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'), doivent être encodées.

Voici un rappel de la structure du jeu de données :

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.

Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé df contenant des données sur les manchots.
Votre tâche consiste à encoder toutes les variables catégorielles afin que les données puissent être utilisées dans un modèle d'apprentissage automatique.

  1. Importez les classes OneHotEncoder et LabelEncoder depuis sklearn.preprocessing.
  2. Séparez la matrice de caractéristiques X et la variable cible y à partir du DataFrame.
  3. Créez un objet OneHotEncoder et appliquez-le aux colonnes 'island' et 'sex' de X.
  4. Remplacez les colonnes catégorielles d'origine par les colonnes encodées.
  5. Créez un objet LabelEncoder et appliquez-le à la colonne 'species' pour encoder la variable cible y.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 8
single

single

some-alt