Contenu du cours
Principes Fondamentaux de la Vision par Ordinateur
Principes Fondamentaux de la Vision par Ordinateur
Aplatissement
Transition des extractions de caractéristiques à la classification
Après que les couches de convolution et de pooling ont extrait les caractéristiques essentielles d'une image, l'étape suivante dans un réseau de neurones convolutifs (CNN) est la classification. Étant donné que les couches entièrement connectées nécessitent une entrée unidimensionnelle, il est nécessaire de convertir les cartes de caractéristiques multidimensionnelles dans un format adapté à la classification.
Conversion des cartes de caractéristiques en vecteur 1D
Le flattening est le processus de remodelage de la sortie des couches de convolution et de pooling en un seul vecteur long. Si une carte de caractéristiques a des dimensions X × Y × Z
, le flattening la transforme en un 1D array
de longueur X × Y × Z
.
Par exemple, si la carte de caractéristiques finale a des dimensions 7 × 7 × 64
, le flattening la convertit en un vecteur de dimension (7 × 7 × 64) = 3136-dimensional
. Cela permet aux couches entièrement connectées de traiter efficacement les caractéristiques extraites.
Importance du flattening avant l'entrée dans les couches entièrement connectées
Les couches entièrement connectées fonctionnent selon une structure standard de réseau de neurones, où chaque neurone est connecté à tous les neurones de la couche suivante. Sans flattening, le modèle ne peut pas interpréter correctement la structure spatiale des cartes de caractéristiques. Le flattening garantit :
Transition adéquate de la détection de caractéristiques à la classification ;
Intégration fluide avec les couches entièrement connectées ;
Apprentissage efficace en préservant les motifs extraits pour la prise de décision finale.
En aplatissant les cartes de caractéristiques, les CNN peuvent exploiter les caractéristiques de haut niveau apprises lors de la convolution et du pooling, permettant une classification précise des objets dans une image.
1. Pourquoi l'aplatissement est-il nécessaire dans un CNN ?
2. Si une carte de caractéristiques a des dimensions 10 × 10 × 32, quelle sera la taille de la sortie aplatie ?
Merci pour vos commentaires !