Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Prétraitement du Jeu de Données | Concepts Fondamentaux
Analyse de Clusters avec Python
Section 2. Chapitre 6
single

single

bookDéfi : Prétraitement du Jeu de Données

Glissez pour afficher le menu

Tâche

Swipe to start coding

Un jeu de données synthétique est stocké dans la variable data. L'objectif est de traiter les valeurs manquantes et d'encoder correctement les variables catégorielles.

Procédure à suivre :

  • Remplacer les valeurs manquantes de la colonne 'Age' par la moyenne de cette colonne. Écraser la colonne d'origine avec le résultat.
  • Créer une instance de OneHotEncoder et la stocker dans la variable city_encoder. Veiller à spécifier drop='first' pour éviter le piège des variables fictives.
  • Par défaut, cet encodeur retourne une matrice creuse. Pour assurer la compatibilité avec Pandas par la suite, définir le paramètre sparse_output=False (ou sparse=False pour les versions antérieures) lors de l'initialisation, OU ajouter .toarray() lors de la transformation des données.
  • Encoder les valeurs de la colonne 'City' à l'aide de city_encoder.fit_transform() et stocker le tableau résultant dans la variable city_encoded.
  • Créer une instance de OrdinalEncoder et la stocker dans la variable income_encoder. Puisque les données présentent une hiérarchie naturelle, définir explicitement l'ordre à l'aide du paramètre categories (noter que 'Low' < 'Middle' < 'High').
  • Encoder les valeurs de la colonne 'Income' à l'aide de income_encoder et écraser la colonne 'Income' d'origine avec le résultat.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 6
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

some-alt