Défi : Encodage des Variables Catégorielles
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, vous travaillez avec le jeu de données des manchots (aucune valeur manquante). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.
Swipe to start coding
Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :
- Importez
OneHotEncoderetLabelEncoderdepuissklearn.preprocessing. - Séparez les données en
X(caractéristiques) ety(cible). - Créez un
OneHotEncoderet appliquez-le aux colonnes'island'et'sex'deX. - Remplacez ces colonnes d'origine par leurs versions encodées.
- Utilisez
LabelEncodersur la colonne'species'pour encodery.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
What are the steps to encode the categorical features and target in this dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
How do I choose which encoder to use for each column in the penguins dataset?
Awesome!
Completion rate improved to 3.13
Défi : Encodage des Variables Catégorielles
Glissez pour afficher le menu
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, vous travaillez avec le jeu de données des manchots (aucune valeur manquante). Toutes les caractéristiques catégorielles — y compris la cible 'species' — doivent être encodées pour une utilisation en apprentissage automatique.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.
Swipe to start coding
Vous disposez d'un DataFrame nommé df. Encodez toutes les colonnes catégorielles :
- Importez
OneHotEncoderetLabelEncoderdepuissklearn.preprocessing. - Séparez les données en
X(caractéristiques) ety(cible). - Créez un
OneHotEncoderet appliquez-le aux colonnes'island'et'sex'deX. - Remplacez ces colonnes d'origine par leurs versions encodées.
- Utilisez
LabelEncodersur la colonne'species'pour encodery.
Solution
Merci pour vos commentaires !
single