Contenu du cours
Reconnaissance des Chiffres Manuscrits
Séparation Entraînement Test
En Python, la fonction train_test_split
, faisant partie du module sklearn.model_selection
, est fréquemment utilisée pour diviser un ensemble de données en deux parties : un sous-ensemble d'entraînement et un sous-ensemble de test.
Cette fonction train_test_split()
effectue une partition aléatoire de l'ensemble de données en ces sous-ensembles, déterminée par une taille de test ou une taille d'entraînement prédéfinie.
Swipe to start coding
-
Divisez l'ensemble de données en ensembles d'entraînement et de test. Utilisez uniquement les 1000 premiers échantillons pour le partage.
-
Affichez les formes et les tailles des ensembles d'entraînement et de test obtenus, tant pour la matrice des caractéristiques que pour le vecteur cible.
Solution
Merci pour vos commentaires !