Conteúdo do Curso
Fundamentos de Visão Computacional
Fundamentos de Visão Computacional
Achatamento
Transição da Extração de Características para Classificação
Após as camadas convolucionais e de pooling extraírem características essenciais de uma imagem, o próximo passo em uma rede neural convolucional (CNN) é a classificação. Como as camadas totalmente conectadas exigem uma entrada unidimensional, é necessário converter os mapas de características multidimensionais em um formato adequado para classificação.
Convertendo Mapas de Características em um Vetor 1D
Flattening é o processo de remodelar a saída das camadas convolucionais e de pooling em um único vetor longo. Se um mapa de características possui dimensões X × Y × Z
, o flattening o transforma em um 1D array
de comprimento X × Y × Z
.
Por exemplo, se o mapa de características final possui dimensões 7 × 7 × 64
, o flattening o converte em um vetor de (7 × 7 × 64) = 3136-dimensional
. Isso permite que as camadas totalmente conectadas processem as características extraídas de forma eficiente.
Importância do Flattening Antes de Alimentar as Camadas Totalmente Conectadas
As camadas totalmente conectadas operam em uma estrutura padrão de rede neural, onde cada neurônio se conecta a todos os neurônios da próxima camada. Sem o flattening, o modelo não consegue interpretar corretamente a estrutura espacial dos mapas de características. O flattening garante:
Transição adequada da detecção de características para a classificação;
Integração fluida com as camadas totalmente conectadas;
Aprendizado eficiente ao preservar padrões extraídos para a tomada de decisão final.
Ao achatar os mapas de características, as CNNs podem aproveitar as características de alto nível aprendidas durante a convolução e o pooling, possibilitando a classificação precisa de objetos em uma imagem.
1. Por que o flattening é necessário em uma CNN?
2. Se um mapa de características tem dimensões 10 × 10 × 32, qual será o tamanho da saída após o flattening?
Obrigado pelo seu feedback!