single
Défi : Encodage des Variables Catégorielles
Glissez pour afficher le menu
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, vous travaillez avec le jeu de données des manchots (sans valeurs manquantes). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.
Glissez pour commencer à coder
Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :
- Importez
OneHotEncoderetLabelEncoderdepuissklearn.preprocessing. - Séparez les données en
X(caractéristiques) ety(cible). - Créez un
OneHotEncoderet appliquez-le aux colonnes'island'et'sex'dansX. - Remplacez ces colonnes d'origine par leurs versions encodées.
- Utilisez
LabelEncodersur la colonne'species'pour encodery.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion