Défi : Encodage des Variables Catégorielles
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'
), doivent être encodées.
Voici un rappel de la structure du jeu de données :
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island'
et 'sex'
sont des caractéristiques catégorielles et que 'species'
est une cible catégorielle.
Swipe to start coding
Encoder toutes les variables catégorielles. Utiliser l'encodage one-hot pour les colonnes 'island'
et 'sex'
, et appliquer un label encoder (ou un encodeur de cible similaire) pour la colonne 'species'
. Suivre ces étapes pour réaliser l'encodage.
- Importer
OnehotEncoder
etLabelEncoder
. - Initialiser l'objet d'encodage des variables explicatives.
- Encoder les colonnes de variables catégorielles à l'aide de l'objet
feature_enc
. - Initialiser l'objet d'encodage de la cible.
- Encoder la cible à l'aide de l'objet
label_enc
.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.13
Défi : Encodage des Variables Catégorielles
Glissez pour afficher le menu
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'
), doivent être encodées.
Voici un rappel de la structure du jeu de données :
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island'
et 'sex'
sont des caractéristiques catégorielles et que 'species'
est une cible catégorielle.
Swipe to start coding
Encoder toutes les variables catégorielles. Utiliser l'encodage one-hot pour les colonnes 'island'
et 'sex'
, et appliquer un label encoder (ou un encodeur de cible similaire) pour la colonne 'species'
. Suivre ces étapes pour réaliser l'encodage.
- Importer
OnehotEncoder
etLabelEncoder
. - Initialiser l'objet d'encodage des variables explicatives.
- Encoder les colonnes de variables catégorielles à l'aide de l'objet
feature_enc
. - Initialiser l'objet d'encodage de la cible.
- Encoder la cible à l'aide de l'objet
label_enc
.
Solution
Merci pour vos commentaires !
Awesome!
Completion rate improved to 3.13single