Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Synthèse des Connaissances | Modélisation
Introduction au ML Avec Scikit-Learn

bookDéfi : Synthèse des Connaissances

Dans ce défi, vous appliquerez tout ce que vous avez appris au cours de la formation, de la prétraitement des données à l'entraînement et à l'évaluation du modèle.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Tâche

Swipe to start coding

  1. Encoder la cible.
  2. Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
  3. Créer un ColumnTransformer pour encoder uniquement les colonnes 'island' et 'sex'. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales.
  4. Compléter les valeurs dans un param_grid pour essayer les valeurs suivantes pour le nombre de voisins : [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Créer un objet GridSearchCV avec le KNeighborsClassifier comme modèle.
  6. Construire un pipeline qui commence par ct comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine par GridSearchCV comme estimateur final.
  7. Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
  8. Évaluer le modèle sur l'ensemble de test. (Afficher son score)
  9. Obtenir une prédiction de la cible pour X_test.
  10. Afficher le meilleur estimateur trouvé par grid_search.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 4. Chapitre 10
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 3.13

bookDéfi : Synthèse des Connaissances

Glissez pour afficher le menu

Dans ce défi, vous appliquerez tout ce que vous avez appris au cours de la formation, de la prétraitement des données à l'entraînement et à l'évaluation du modèle.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Tâche

Swipe to start coding

  1. Encoder la cible.
  2. Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
  3. Créer un ColumnTransformer pour encoder uniquement les colonnes 'island' et 'sex'. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales.
  4. Compléter les valeurs dans un param_grid pour essayer les valeurs suivantes pour le nombre de voisins : [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Créer un objet GridSearchCV avec le KNeighborsClassifier comme modèle.
  6. Construire un pipeline qui commence par ct comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine par GridSearchCV comme estimateur final.
  7. Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
  8. Évaluer le modèle sur l'ensemble de test. (Afficher son score)
  9. Obtenir une prédiction de la cible pour X_test.
  10. Afficher le meilleur estimateur trouvé par grid_search.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

close

Awesome!

Completion rate improved to 3.13
Section 4. Chapitre 10
single

single

some-alt