Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Création d'un Pipeline | Pipelines
Introduction au ML avec Scikit-learn

bookDéfi : Création d'un Pipeline

Dans ce défi, regrouper toutes les étapes de prétraitement dans un seul pipeline en utilisant le jeu de données original penguins.csv.

  1. Supprimer les deux lignes avec des données insuffisantes.
  2. Construire un pipeline incluant l'encodage, l'imputation et la normalisation.

Il est nécessaire d'encoder uniquement deux colonnes, 'sex' et 'island'. Comme il n'est pas souhaité d'encoder l'ensemble de X, il faut utiliser un ColumnTransformer. Ensuite, appliquer le SimpleImputer et le StandardScaler à l'ensemble de X.

Voici un rappel des fonctions make_column_transformer() et make_pipeline() que vous utiliserez.

Tâche

Swipe to start coding

  1. Importer la fonction appropriée pour créer un pipeline.
  2. Créer un ColumnTransformer avec le OneHotEncoder appliqué uniquement aux colonnes 'sex' et 'island'.
  3. S'assurer que toutes les autres colonnes restent inchangées.
  4. Créer un pipeline contenant le ct que vous venez de créer, un SimpleImputer qui remplit les valeurs manquantes avec la valeur la plus fréquente, et un StandardScaler en dernière étape.
  5. Transformer X en utilisant le pipe que vous avez créé.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 4
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Création d'un Pipeline

Glissez pour afficher le menu

Dans ce défi, regrouper toutes les étapes de prétraitement dans un seul pipeline en utilisant le jeu de données original penguins.csv.

  1. Supprimer les deux lignes avec des données insuffisantes.
  2. Construire un pipeline incluant l'encodage, l'imputation et la normalisation.

Il est nécessaire d'encoder uniquement deux colonnes, 'sex' et 'island'. Comme il n'est pas souhaité d'encoder l'ensemble de X, il faut utiliser un ColumnTransformer. Ensuite, appliquer le SimpleImputer et le StandardScaler à l'ensemble de X.

Voici un rappel des fonctions make_column_transformer() et make_pipeline() que vous utiliserez.

Tâche

Swipe to start coding

  1. Importer la fonction appropriée pour créer un pipeline.
  2. Créer un ColumnTransformer avec le OneHotEncoder appliqué uniquement aux colonnes 'sex' et 'island'.
  3. S'assurer que toutes les autres colonnes restent inchangées.
  4. Créer un pipeline contenant le ct que vous venez de créer, un SimpleImputer qui remplit les valeurs manquantes avec la valeur la plus fréquente, et un StandardScaler en dernière étape.
  5. Transformer X en utilisant le pipe que vous avez créé.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 4
single

single

some-alt