Apprendre Résumé de la Modélisation

Glissez pour afficher le menu

Vous savez désormais comment construire un modèle, utiliser des pipelines et ajuster des hyperparamètres. Vous avez également appris deux méthodes d'évaluation : la séparation train-test et la validation croisée. L'étape suivante consiste à combiner l'évaluation et l'ajustement à l'aide de GridSearchCV ou RandomizedSearchCV.

Remarque

Comme notre jeu de données est très petit, nous utiliserons le GridSearchCV, mais tout ce qui est mentionné ci-dessous s'applique également à un RandomizedSearchCV.

Puisque la validation croisée est plus stable qu'une simple séparation train-test, l'objectif est d'obtenir le meilleur score de validation croisée. GridSearchCV explore les hyperparamètres et identifie ceux qui maximisent ce score. Le meilleur score est stocké dans .best_score_.

Remarque

Les hyperparamètres qui fonctionnent le mieux pour un ensemble de données peuvent ne pas se généraliser lors de l'arrivée de nouvelles données. Ainsi, .best_score_ peut être supérieur à la performance du modèle sur des données totalement inédites.

Flux de travail courant : division en ensembles d'entraînement et de test ; exécution de la validation croisée sur l'ensemble d'entraînement pour ajuster le modèle ; puis évaluation du modèle optimisé sur l'ensemble de test afin de mesurer la performance en conditions réelles.

Résumé :

Prétraitement des données ;
Division en ensembles d'entraînement et de test ;
Utilisation de la validation croisée sur l'ensemble d'entraînement pour trouver la meilleure configuration ;
Évaluation sur l'ensemble de test.

Approfondir

La troisième étape consiste généralement à tester plusieurs algorithmes et à ajuster leurs hyperparamètres afin d’identifier la meilleure option. Par souci de simplicité, un seul algorithme a été utilisé dans ce cours.

La validation croisée n’est pas toujours la meilleure option. Pour les grands ensembles de données, le calcul des scores de validation croisée devient coûteux, tandis qu’une séparation train-test devient plus stable grâce à la taille importante du jeu de test.

Les grands ensembles de données sont souvent divisés en ensembles de formation, de validation et de test. Les hyperparamètres sont choisis en fonction des performances sur l’ensemble de validation. Enfin, le modèle sélectionné est évalué sur l’ensemble de test afin de vérifier sa capacité de généralisation.

Le jeu de données des manchots est de petite taille, avec seulement 342 instances. En raison de cette taille limitée, le score de validation croisée sera utilisé pour l'évaluation dans le prochain chapitre.

Pourquoi la validation croisée est-elle particulièrement précieuse pour l’ajustement des hyperparamètres dans les petits jeux de données, contrairement aux jeux de données plus volumineux où des séparations train-test pourraient être préférées ?

Select the correct answer

La validation croisée est moins coûteuse en calcul, ce qui la rend idéale pour les petits jeux de données.

Les grands jeux de données fournissent intrinsèquement des résultats plus précis, donc la validation croisée est inutile.

La validation croisée garantit que chaque point de données est utilisé à la fois pour l’entraînement et la validation, ce qui est crucial dans les petits jeux de données où les points de données sont limités.

Les scores de validation croisée sont moins fiables que les scores de l’ensemble de validation, qui ne sont utilisés que dans les grands jeux de données.

Tout était clair ?

Merci pour vos commentaires !

Section 4. Chapitre 9

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 4. Chapitre 9