Section 4. Chapitre 10
single
Défi : Tout Rassembler
Glissez pour afficher le menu
Dans ce défi, appliquez l'ensemble du flux de travail appris dans le cours — de la prétraitement des données à l'entraînement jusqu'à l'évaluation du modèle.
Tâche
Glissez pour commencer à coder
Vous travaillez avec un jeu de données de manchots. Construisez un pipeline de ML pour classifier les espèces avec KNN, en gérant l'encodage, les valeurs manquantes, la mise à l'échelle et l'ajustement des hyperparamètres.
- Encoder
yavecLabelEncoder. - Diviser avec
train_test_split(test_size=0.33). - Créer
ct:OneHotEncodersur'island','sex',remainder='passthrough'. - Définir
param_gridpourn_neighbors,weights,p. Pourn_neighbors, il est préférable d'utiliser des valeurs impaires entières. - Créer
GridSearchCV(KNeighborsClassifier(), param_grid). - Pipeline :
ct→SimpleImputer('most_frequent')→StandardScaler→GridSearchCV. - Ajuster sur l'ensemble d'entraînement.
- Afficher le
.scoresur le test. - Prédire, afficher les 5 premières étiquettes décodées.
- Afficher
.best_estimator_.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 10
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion