Défi : Encodage des Variables Catégorielles
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'), doivent être encodées.
Voici un rappel de la structure du jeu de données :
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.
Swipe to start coding
Vous disposez d'un DataFrame nommé df contenant des données sur les manchots.
Votre tâche consiste à encoder toutes les variables catégorielles afin que les données puissent être utilisées dans un modèle d'apprentissage automatique.
- Importez les classes
OneHotEncoderetLabelEncoderdepuissklearn.preprocessing. - Séparez la matrice de caractéristiques
Xet la variable cibleyà partir duDataFrame. - Créez un objet
OneHotEncoderet appliquez-le aux colonnes'island'et'sex'deX. - Remplacez les colonnes catégorielles d'origine par les colonnes encodées.
- Créez un objet
LabelEncoderet appliquez-le à la colonne'species'pour encoder la variable cibley.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.13
Défi : Encodage des Variables Catégorielles
Glissez pour afficher le menu
Pour résumer les trois chapitres précédents, voici un tableau indiquant quel encodeur utiliser :
Dans ce défi, le jeu de données des manchots (sans valeurs manquantes) est fourni. Toutes les caractéristiques catégorielles, y compris la cible (colonne 'species'), doivent être encodées.
Voici un rappel de la structure du jeu de données :
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Gardez à l'esprit que 'island' et 'sex' sont des caractéristiques catégorielles et que 'species' est une cible catégorielle.
Swipe to start coding
Vous disposez d'un DataFrame nommé df contenant des données sur les manchots.
Votre tâche consiste à encoder toutes les variables catégorielles afin que les données puissent être utilisées dans un modèle d'apprentissage automatique.
- Importez les classes
OneHotEncoderetLabelEncoderdepuissklearn.preprocessing. - Séparez la matrice de caractéristiques
Xet la variable cibleyà partir duDataFrame. - Créez un objet
OneHotEncoderet appliquez-le aux colonnes'island'et'sex'deX. - Remplacez les colonnes catégorielles d'origine par les colonnes encodées.
- Créez un objet
LabelEncoderet appliquez-le à la colonne'species'pour encoder la variable cibley.
Solution
Merci pour vos commentaires !
single