Contenido del Curso
Fundamentos de Visión por Computadora
Fundamentos de Visión por Computadora
Supresión No Máxima (NMS)
Los modelos de detección de objetos suelen predecir múltiples cajas delimitadoras superpuestas para el mismo objeto. Esto ocurre porque los modelos examinan una imagen en diferentes escalas y posiciones, lo que genera predicciones redundantes. La Supresión de No Máximos (NMS) es un paso crucial de post-procesamiento que refina estas detecciones seleccionando las cajas delimitadoras más relevantes y descartando las innecesarias.
Por qué ocurren múltiples cajas superpuestas
Los detectores de objetos predicen múltiples cajas delimitadoras para un solo objeto debido a:
Cajas ancla: algunos modelos, como Faster R-CNN y YOLO, utilizan cajas ancla predefinidas de diferentes tamaños, lo que conduce a múltiples detecciones del mismo objeto;
Enfoques de ventana deslizante: algunos métodos de detección examinan una imagen en pequeñas regiones, causando detecciones repetidas de un objeto dentro de áreas superpuestas;
Altas puntuaciones de confianza: el modelo asigna puntuaciones de confianza a cada predicción, y las predicciones similares con alta confianza pueden superponerse significativamente.
Si estas cajas redundantes no se filtran, pueden afectar negativamente el rendimiento de la detección de objetos al aumentar la complejidad computacional y hacer que el conteo de objetos sea poco fiable.
Cómo funciona la Supresión de No Máximos
NMS se aplica para eliminar detecciones duplicadas mientras se conserva la caja delimitadora con mayor confianza. Sigue estos pasos:
Ordenar por puntuación: organizar todas las cajas delimitadoras predichas en orden descendente según sus puntuaciones de confianza;
Seleccionar la mejor caja: elegir la caja con mayor puntuación y añadirla a la lista final de detecciones;
Cálculo de IoU: calcular la Intersección sobre Unión (IoU) entre la caja seleccionada y todas las cajas restantes;
Umbralización: suprimir (eliminar) las cajas que tengan un IoU por encima de un umbral establecido (por ejemplo, 0.5), ya que probablemente representan el mismo objeto;
Repetir: continuar este proceso con la siguiente caja de mayor puntuación hasta procesar todas las cajas.
Soft-NMS: Una alternativa más inteligente
NMS estándar elimina todas las cajas superpuestas por encima de un cierto umbral de IoU, lo que a veces puede descartar detecciones útiles. Soft-NMS mejora este proceso al reducir las puntuaciones de confianza de las cajas superpuestas en lugar de eliminarlas completamente. Este método permite un proceso de supresión más suave y puede mejorar el rendimiento de detección en escenarios con objetos densos.
Diferencias clave entre NMS estándar y Soft-NMS:
NMS estándar: elimina las cajas superpuestas por encima del umbral de IoU;
Soft-NMS: reduce las puntuaciones de confianza de las cajas superpuestas en lugar de eliminarlas, lo que lo hace más flexible para detectar objetos parcialmente ocluidos.
Equilibrio entre precisión y velocidad en NMS
La elección del umbral de IoU adecuado es fundamental:
Umbrales más altos (por ejemplo, 0.6 - 0.7): filtrado más agresivo, conservando solo las cajas más confiables pero posiblemente omitiendo algunas detecciones válidas;
Umbrales más bajos (por ejemplo, 0.3 - 0.4): retiene más cajas superpuestas, lo que puede ser útil en escenas concurridas pero puede aumentar los falsos positivos.
El uso de implementaciones optimizadas, como las funciones NMS integradas en TensorFlow u OpenCV, puede ayudar a acelerar el procesamiento para aplicaciones en tiempo real.
Non-Max Suppression es una técnica fundamental en la detección de objetos para eliminar cajas delimitadoras redundantes y mejorar la precisión del modelo. NMS estándar elimina eficientemente las detecciones duplicadas, mientras que Soft-NMS refina el proceso ajustando las puntuaciones de confianza en lugar de eliminarlas completamente. Al ajustar los umbrales de IoU, se puede lograr el equilibrio adecuado entre precisión de detección y eficiencia computacional.
1. ¿Cuál es el propósito principal de la Supresión de No Máximos (NMS) en la detección de objetos?
2. ¿Cómo determina la NMS estándar qué cajas delimitadoras suprimir?
3. ¿Cuál es la diferencia clave entre la NMS estándar y la Soft-NMS?
¡Gracias por tus comentarios!