Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Tout Rassembler | Modélisation
Introduction au ML Avec Scikit-Learn

bookDéfi : Tout Rassembler

Dans ce défi, appliquez l'ensemble du flux de travail appris dans le cours — de la prétraitement des données à l'entraînement jusqu'à l'évaluation du modèle.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Tâche

Swipe to start coding

Un jeu de données de manchots vous est fourni. Votre objectif est de construire une pipeline d'apprentissage automatique qui classifie les espèces de manchots à l'aide d'un modèle K-Nearest Neighbors (KNN), tout en gérant correctement l'encodage, les valeurs manquantes et l'optimisation des paramètres.

  1. Encoder la variable cible en utilisant LabelEncoder.
  2. Diviser le jeu de données en ensembles d'entraînement et de test avec test_size=0.33.
  3. Créer un ColumnTransformer (ct) qui encode uniquement les colonnes 'island' et 'sex' à l'aide d'un encodeur adapté aux données nominales (OneHotEncoder) et laisse les autres colonnes inchangées.
  4. Définir une grille de paramètres (param_grid) incluant les valeurs suivantes pour n_neighbors : [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Créer un objet GridSearchCV avec KNeighborsClassifier comme estimateur de base et param_grid comme paramètres.
  6. Construire une pipeline composée de :
  • le ColumnTransformer (ct);
  • un SimpleImputer (strategy = 'most_frequent');
  • un StandardScaler;
  • et le GridSearchCV comme étape finale.
  1. Entraîner la pipeline en utilisant les données d'entraînement (X_train, y_train).
  2. Évaluer le modèle sur les données de test en affichant son .score(X_test, y_test).
  3. Prédire sur l'ensemble de test et afficher les 5 premières prédictions décodées à l'aide de label_enc.inverse_transform().
  4. Enfin, afficher le meilleur estimateur trouvé par GridSearchCV.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 10
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Tout Rassembler

Glissez pour afficher le menu

Dans ce défi, appliquez l'ensemble du flux de travail appris dans le cours — de la prétraitement des données à l'entraînement jusqu'à l'évaluation du modèle.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Tâche

Swipe to start coding

Un jeu de données de manchots vous est fourni. Votre objectif est de construire une pipeline d'apprentissage automatique qui classifie les espèces de manchots à l'aide d'un modèle K-Nearest Neighbors (KNN), tout en gérant correctement l'encodage, les valeurs manquantes et l'optimisation des paramètres.

  1. Encoder la variable cible en utilisant LabelEncoder.
  2. Diviser le jeu de données en ensembles d'entraînement et de test avec test_size=0.33.
  3. Créer un ColumnTransformer (ct) qui encode uniquement les colonnes 'island' et 'sex' à l'aide d'un encodeur adapté aux données nominales (OneHotEncoder) et laisse les autres colonnes inchangées.
  4. Définir une grille de paramètres (param_grid) incluant les valeurs suivantes pour n_neighbors : [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Créer un objet GridSearchCV avec KNeighborsClassifier comme estimateur de base et param_grid comme paramètres.
  6. Construire une pipeline composée de :
  • le ColumnTransformer (ct);
  • un SimpleImputer (strategy = 'most_frequent');
  • un StandardScaler;
  • et le GridSearchCV comme étape finale.
  1. Entraîner la pipeline en utilisant les données d'entraînement (X_train, y_train).
  2. Évaluer le modèle sur les données de test en affichant son .score(X_test, y_test).
  3. Prédire sur l'ensemble de test et afficher les 5 premières prédictions décodées à l'aide de label_enc.inverse_transform().
  4. Enfin, afficher le meilleur estimateur trouvé par GridSearchCV.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 10
single

single

some-alt