Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Couches de Convolution | Section
Practice
Projects
Quizzes & Challenges
Quiz
Challenges
/
Vision par Ordinateur Appliquée

bookCouches de Convolution

Glissez pour afficher le menu

Les couches de convolution constituent le cœur des réseaux de neurones convolutifs (CNN). Elles appliquent la convolution, où une petite matrice appelée filtre (ou noyau) glisse sur une image afin de détecter les contours, les textures et les formes. Cela permet aux CNN de traiter les images de manière plus efficace que les réseaux traditionnels.

Au lieu d'analyser une image entière en une seule fois, les CNN la divisent en sections plus petites, détectant des caractéristiques à différents niveaux. Les premières couches reconnaissent des motifs simples comme les bords, tandis que les couches plus profondes détectent des structures complexes.

Fonctionnement de la convolution

La convolution implique le déplacement d’un filtre (noyau) sur une image, selon les étapes suivantes :

  1. Appliquer le noyau en haut à gauche de l’image ;
  2. Effectuer une multiplication élément par élément entre le noyau et les valeurs des pixels ;
  3. Additionner les produits pour générer un pixel de sortie ;
  4. Déplacer le noyau selon le pas (stride) et répéter ;
  5. Générer une carte de caractéristiques mettant en évidence les motifs détectés.
GIF de convolution

De multiples filtres permettent aux CNN de capturer différentes caractéristiques, telles que les bords verticaux, les courbes et les textures.

Filtres (noyaux) :

Les filtres jouent un rôle essentiel dans l'extraction de motifs significatifs à partir des images. Différents types de filtres sont spécialisés dans l'identification de diverses caractéristiques :

  • Filtres de détection de bords : identification des contours d'objets en détectant des changements brusques d'intensité (par exemple, filtres Sobel, Prewitt et Laplacien) ;
  • Filtres de texture : capture de motifs répétitifs tels que des vagues ou des grilles (par exemple, filtres de Gabor) ;
  • Filtres de renforcement : amélioration des détails de l'image en amplifiant les composantes à haute fréquence ;
  • Filtres de flou : réduction du bruit et lissage des images (par exemple, filtre de flou gaussien) ;
  • Filtres d'embossage : mise en valeur des bords et ajout d'un effet 3D en accentuant la profondeur.
Comparaison des noyaux

Chaque filtre est entraîné à détecter des motifs spécifiques et contribue à la construction de représentations hiérarchiques des caractéristiques dans les CNN profonds.

Les couches de convolution réutilisent le même filtre sur toute l'image, ce qui réduit le nombre de paramètres et rend les CNN efficaces. Cependant, les couches localement connectées spécialisées utilisent des filtres différents pour différentes régions lorsque cela est nécessaire.

En empilant les couches de convolution, les CNN extraient des motifs détaillés, ce qui les rend puissants pour la classification d'images, la détection d'objets et les tâches de vision.

Hyperparamètres :

  • Stride : contrôle la distance parcourue par le filtre à chaque étape ;
  • Padding : ajoute des pixels pour contrôler la taille de la sortie (le padding "same" préserve la taille, le padding "valid" la réduit) ;
  • Nombre de filtres (profondeur) : un plus grand nombre de filtres améliore la détection des caractéristiques mais augmente le calcul.
Note
Note

Exemple : Pour une image en niveaux de gris de 24×24 utilisant un noyau de 3×3 avec 64 filters, la taille de sortie est de 22×22×64, calculée comme suit :

(WF+1)×(HF+1)×D==(243+1)×(243+1)×64==22×22×64,(W - F + 1) \times (H - F + 1) \times D =\\= (24 - 3 + 1) \times (24 - 3 + 1) \times 64 =\\= 22\times22\times64,

Où :

  • WW : largeur de l'image d'entrée = 24 ;
  • HH : hauteur de l'image d'entrée = 24 ;
  • FF : taille du filtre (noyau) = 3 (en supposant un noyau carré 3×3) ;
  • DD : nombre de filtres (profondeur de la sortie) = 64.

Avant le prochain chapitre

Bien que les couches convolutionnelles puissent réduire la taille de la sortie, leur objectif principal est l'extraction de caractéristiques, et non la réduction de la dimensionnalité. Les couches de pooling, en revanche, réduisent explicitement la dimensionnalité tout en conservant les informations importantes, assurant ainsi l'efficacité dans les couches plus profondes.

1. Quel est le rôle principal d'une couche convolutionnelle dans un CNN ?

2. Quel hyperparamètre détermine de combien un filtre se déplace lors de la convolution ?

3. Quel est le but d'appliquer plusieurs filtres dans une couche de convolution ?

question mark

Quel est le rôle principal d'une couche convolutionnelle dans un CNN ?

Select the correct answer

question mark

Quel hyperparamètre détermine de combien un filtre se déplace lors de la convolution ?

Select the correct answer

question mark

Quel est le but d'appliquer plusieurs filtres dans une couche de convolution ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 13

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 1. Chapitre 13
some-alt