Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Séparation Entraînement Test | Reconnaissance des Chiffres Manuscrits
Reconnaissance des Chiffres Manuscrits

book
Séparation Entraînement Test

En Python, la fonction train_test_split, faisant partie du module sklearn.model_selection, est fréquemment utilisée pour diviser un ensemble de données en deux parties : un sous-ensemble d'entraînement et un sous-ensemble de test.

Cette fonction train_test_split() effectue une partition aléatoire de l'ensemble de données en ces sous-ensembles, déterminée par une taille de test ou une taille d'entraînement prédéfinie.

Tâche

Swipe to start coding

  1. Divisez l'ensemble de données en ensembles d'entraînement et de test. Utilisez uniquement les 1000 premiers échantillons pour le partage.

  2. Affichez les formes et les tailles des ensembles d'entraînement et de test obtenus, tant pour la matrice des caractéristiques que pour le vecteur cible.

Solution

from sklearn.model_selection import train_test_split

# Split the data
X_train, X_test, y_train, y_test = train_test_split(X[:1000], Y[:1000], test_size=1/7)

# Print the resulting shapes and sizes
print('TRAIN Feature matrix shape:', X_train.shape)
print('TRAIN Target vector size:', y_train.size)
print('TEST Feature matrix shape:', X_test.shape)
print('TEST Target vector size:', y_test.size)

Mark tasks as Completed
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 6
AVAILABLE TO ULTIMATE ONLY
some-alt