Kursinhalt
Computer Vision Essentials
Computer Vision Essentials
Flattening
Übergang von der Merkmalsextraktion zur Klassifikation
Nachdem Faltungs- und Pooling-Schichten wesentliche Merkmale aus einem Bild extrahiert haben, folgt in einem Convolutional Neural Network (CNN) als nächster Schritt die Klassifikation. Da vollständig verbundene Schichten eine eindimensionale Eingabe benötigen, müssen die mehrdimensionalen Merkmalskarten in ein geeignetes Format für die Klassifikation umgewandelt werden.
Umwandlung von Merkmalskarten in einen 1D-Vektor
Flattening bezeichnet den Prozess, bei dem die Ausgaben der Faltungs- und Pooling-Schichten in einen einzigen langen Vektor umgeformt werden. Hat eine Merkmalskarte die Dimensionen X × Y × Z
, wandelt Flattening diese in ein 1D array
der Länge X × Y × Z
um.
Beispielsweise wird eine Merkmalskarte mit den Dimensionen 7 × 7 × 64
durch Flattening in einen (7 × 7 × 64) = 3136-dimensional
Vektor umgewandelt. Dadurch können die vollständig verbundenen Schichten die extrahierten Merkmale effizient verarbeiten.
Bedeutung des Flattenings vor der Übergabe an vollständig verbundene Schichten
Vollständig verbundene Schichten arbeiten nach einer Standardstruktur neuronaler Netze, bei der jedes Neuron mit jedem Neuron der nächsten Schicht verbunden ist. Ohne Flattening kann das Modell die räumliche Struktur der Merkmalskarten nicht korrekt interpretieren. Flattening gewährleistet:
Korrekte Überleitung von der Merkmalsdetektion zur Klassifikation;
Nahtlose Integration mit vollständig verbundenen Schichten;
Effizientes Lernen durch Erhalt der extrahierten Muster für die abschließende Entscheidungsfindung.
Durch das Flattening der Merkmalskarten können CNNs die während der Faltung und des Poolings gelernten hochrangigen Merkmale nutzen und so eine präzise Klassifikation von Objekten innerhalb eines Bildes ermöglichen.
1. Warum ist das Flattening in einem CNN notwendig?
2. Wenn eine Feature-Map die Dimensionen 10 × 10 × 32 hat, wie groß ist die Ausgabe nach dem Flattening?
Danke für Ihr Feedback!