Défi : Synthèse des Connaissances
Dans ce défi, vous appliquerez tout ce que vous avez appris au cours de la formation, de la prétraitement des données à l'entraînement et à l'évaluation du modèle.





Tâche
Swipe to start coding
- Encoder la cible.
- Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
- Créer un
ColumnTransformer
pour encoder uniquement les colonnes'island'
et'sex'
. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales. - Compléter les valeurs dans un
param_grid
pour essayer les valeurs suivantes pour le nombre de voisins :[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Créer un objet
GridSearchCV
avec leKNeighborsClassifier
comme modèle. - Construire un pipeline qui commence par
ct
comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine parGridSearchCV
comme estimateur final. - Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
- Évaluer le modèle sur l'ensemble de test. (Afficher son score)
- Obtenir une prédiction de la cible pour
X_test
. - Afficher le meilleur estimateur trouvé par
grid_search
.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 10
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.13
Défi : Synthèse des Connaissances
Glissez pour afficher le menu
Dans ce défi, vous appliquerez tout ce que vous avez appris au cours de la formation, de la prétraitement des données à l'entraînement et à l'évaluation du modèle.





Tâche
Swipe to start coding
- Encoder la cible.
- Diviser les données de sorte que 33% soient utilisées pour l'ensemble de test et le reste pour l'ensemble d'entraînement.
- Créer un
ColumnTransformer
pour encoder uniquement les colonnes'island'
et'sex'
. S'assurer que les autres colonnes restent inchangées. Utiliser un encodeur approprié pour les données nominales. - Compléter les valeurs dans un
param_grid
pour essayer les valeurs suivantes pour le nombre de voisins :[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Créer un objet
GridSearchCV
avec leKNeighborsClassifier
comme modèle. - Construire un pipeline qui commence par
ct
comme première étape, suivi de l'imputation avec la valeur la plus fréquente, de la standardisation, et se termine parGridSearchCV
comme estimateur final. - Entraîner le modèle à l'aide du pipeline sur l'ensemble d'entraînement.
- Évaluer le modèle sur l'ensemble de test. (Afficher son score)
- Obtenir une prédiction de la cible pour
X_test
. - Afficher le meilleur estimateur trouvé par
grid_search
.
Solution
Tout était clair ?
Merci pour vos commentaires !
Awesome!
Completion rate improved to 3.13Section 4. Chapitre 10
single