Conteúdo do Curso
Fundamentos de Visão Computacional
Fundamentos de Visão Computacional
Supressão Não Máxima (NMS)
Modelos de detecção de objetos frequentemente preveem múltiplas caixas delimitadoras sobrepostas para o mesmo objeto. Isso ocorre porque os modelos analisam uma imagem em diferentes escalas e posições, resultando em previsões redundantes. Non-Max Suppression (NMS) é uma etapa fundamental de pós-processamento que refina essas detecções ao selecionar as caixas delimitadoras mais relevantes e descartar as desnecessárias.
Por que Ocorrências de Caixas Sobrepostas
Detectores de objetos preveem múltiplas caixas delimitadoras para um único objeto devido a:
Anchor boxes: alguns modelos, como Faster R-CNN e YOLO, utilizam anchor boxes predefinidas de diferentes tamanhos, levando a múltiplas detecções do mesmo objeto;
Abordagens de janela deslizante: alguns métodos de detecção analisam uma imagem em pequenas regiões, causando detecções repetidas de um objeto em áreas sobrepostas;
Altas pontuações de confiança: o modelo atribui pontuações de confiança a cada previsão, e previsões semelhantes com alta confiança podem se sobrepor significativamente.
Se essas caixas redundantes não forem filtradas, podem impactar negativamente o desempenho da detecção de objetos ao aumentar a complexidade computacional e tornar a contagem de objetos não confiável.
Como Funciona o Non-Max Suppression
O NMS é aplicado para remover detecções duplicadas enquanto mantém a caixa delimitadora mais confiável. Ele segue estes passos:
Ordenação por pontuação: organiza todas as caixas delimitadoras previstas em ordem decrescente de suas pontuações de confiança;
Seleção da melhor caixa: seleciona a caixa com maior pontuação e a adiciona à lista final de detecções;
Cálculo do IoU: calcula a Interseção sobre União (IoU) entre a caixa selecionada e todas as caixas restantes;
Limite: suprime (remove) as caixas que possuem IoU acima de um limite definido (por exemplo, 0.5), pois provavelmente representam o mesmo objeto;
Repetição: continua esse processo para a próxima caixa com maior pontuação até que todas as caixas sejam processadas.
Soft-NMS: Uma Alternativa Mais Inteligente
NMS Padrão remove todas as caixas sobrepostas acima de um determinado limiar de IoU, o que pode, às vezes, eliminar detecções úteis. Soft-NMS aprimora esse processo ao decair as pontuações de confiança das caixas sobrepostas em vez de removê-las completamente. Esse método permite uma supressão mais suave e pode melhorar o desempenho da detecção em cenários com objetos densos.
Principais Diferenças entre NMS Padrão e Soft-NMS:
NMS Padrão: remove caixas sobrepostas acima do limiar de IoU;
Soft-NMS: reduz as pontuações de confiança das caixas sobrepostas em vez de eliminá-las, tornando-o mais flexível para detectar objetos parcialmente ocluídos.
Equilíbrio entre Precisão e Velocidade no NMS
A escolha do limiar de IoU adequado é fundamental:
Limiares mais altos (por exemplo, 0.6 - 0.7): filtragem mais agressiva, mantendo apenas as caixas mais confiáveis, mas possivelmente perdendo algumas detecções válidas;
Limiares mais baixos (por exemplo, 0.3 - 0.4): retém mais caixas sobrepostas, o que pode ser útil em cenas lotadas, mas pode aumentar os falsos positivos.
O uso de implementações otimizadas, como as funções NMS integradas do TensorFlow ou OpenCV, pode ajudar a acelerar o processamento para aplicações em tempo real.
Non-Max Suppression é uma técnica fundamental em detecção de objetos para remover caixas delimitadoras redundantes e melhorar a precisão do modelo. NMS Padrão elimina eficientemente detecções duplicadas, enquanto o Soft-NMS refina o processo ajustando as pontuações de confiança em vez de removê-las completamente. Ao ajustar os limiares de IoU, é possível alcançar o equilíbrio ideal entre precisão de detecção e eficiência computacional.
1. Qual é o principal objetivo da Supressão Não Máxima (NMS) na detecção de objetos?
2. Como a NMS padrão determina quais caixas delimitadoras devem ser suprimidas?
3. Qual é a principal diferença entre a NMS padrão e a Soft-NMS?
Obrigado pelo seu feedback!