Défi : Encodage des Variables Catégorielles
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'
), doivent être encodées.
Voici un rappel de la structure du jeu de données :
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island'
et 'sex'
sont des caractéristiques catégorielles et que 'species'
est une cible catégorielle.
Swipe to start coding
Encoder toutes les variables catégorielles. Utiliser l'encodage one-hot pour les colonnes 'island'
et 'sex'
, et appliquer un label encoder (ou un encodeur de cible similaire) pour la colonne 'species'
. Suivre ces étapes pour réaliser l'encodage.
- Importer
OnehotEncoder
etLabelEncoder
. - Initialiser l'objet d'encodage des variables explicatives.
- Encoder les colonnes de variables catégorielles à l'aide de l'objet
feature_enc
. - Initialiser l'objet d'encodage de la cible.
- Encoder la cible à l'aide de l'objet
label_enc
.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Défi : Encodage des Variables Catégorielles
Glissez pour afficher le menu
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'
), doivent être encodées.
Voici un rappel de la structure du jeu de données :
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island'
et 'sex'
sont des caractéristiques catégorielles et que 'species'
est une cible catégorielle.
Swipe to start coding
Encoder toutes les variables catégorielles. Utiliser l'encodage one-hot pour les colonnes 'island'
et 'sex'
, et appliquer un label encoder (ou un encodeur de cible similaire) pour la colonne 'species'
. Suivre ces étapes pour réaliser l'encodage.
- Importer
OnehotEncoder
etLabelEncoder
. - Initialiser l'objet d'encodage des variables explicatives.
- Encoder les colonnes de variables catégorielles à l'aide de l'objet
feature_enc
. - Initialiser l'objet d'encodage de la cible.
- Encoder la cible à l'aide de l'objet
label_enc
.
Solution
Merci pour vos commentaires !
Awesome!
Completion rate improved to 3.13single