Зміст курсу
Основи Комп'ютерного Зору
Основи Комп'ютерного Зору
Приглушення Немаксимальних Значень (NMS)
Моделі виявлення об'єктів часто прогнозують кілька перекривних обмежувальних рамок для одного й того ж об'єкта. Це відбувається тому, що моделі сканують зображення на різних масштабах і позиціях, що призводить до надлишкових передбачень. Non-Max Suppression (NMS) — це важливий етап постобробки, який уточнює ці виявлення, обираючи найбільш релевантні обмежувальні рамки та відкидаючи зайві.
Чому виникають кілька перекривних рамок
Детектори об'єктів прогнозують кілька обмежувальних рамок для одного об'єкта через:
Якірні рамки: деякі моделі, такі як Faster R-CNN та YOLO, використовують заздалегідь визначені якорі різних розмірів, що призводить до кількох виявлень одного й того ж об'єкта;
Підхід ковзного вікна: деякі методи виявлення сканують зображення невеликими регіонами, що спричиняє повторні виявлення об'єкта в перекривних областях;
Високі оцінки впевненості: модель призначає кожному передбаченню оцінку впевненості, і схожі передбачення з високою впевненістю можуть значно перекриватися.
Якщо ці надлишкові рамки не відфільтрувати, це може негативно вплинути на продуктивність виявлення об'єктів, збільшуючи обчислювальну складність і роблячи підрахунок об'єктів ненадійним.
Як працює Non-Max Suppression
NMS застосовується для видалення дубльованих виявлень, залишаючи найбільш впевнену обмежувальну рамку. Основні етапи:
Сортування за оцінкою: впорядкувати всі передбачені обмежувальні рамки у спадному порядку за їхніми оцінками впевненості;
Вибір найкращої рамки: обрати рамку з найвищою оцінкою та додати її до фінального списку виявлень;
Обчислення IoU: розрахувати Intersection Over Union (IoU) між вибраною рамкою та всіма іншими, що залишилися;
Поріг: придушити (видалити) рамки, які мають IoU вище заданого порогу (наприклад, 0.5), оскільки вони, ймовірно, представляють той самий об'єкт;
Повторення: продовжувати цей процес для наступної рамки з найвищою оцінкою, доки всі рамки не будуть оброблені.
Soft-NMS: розумніша альтернатива
Стандартний NMS видаляє всі перекривні бокси, які перевищують певний поріг IoU, що іноді може призвести до втрати корисних детекцій. Soft-NMS удосконалює цей підхід, зменшуючи значення довіри перекривних боксів замість їх повного видалення. Такий метод забезпечує більш плавний процес придушення та може підвищити якість детекції у щільних сценах.
Основні відмінності між стандартним NMS та Soft-NMS:
Стандартний NMS: видаляє перекривні бокси, що перевищують поріг IoU;
Soft-NMS: зменшує значення довіри перекривних боксів замість їх видалення, що робить його більш гнучким для виявлення частково перекритих об'єктів.
Балансування точності та швидкості в NMS
Вибір правильного порогу IoU є критичним:
Вищі пороги (наприклад, 0.6 - 0.7): агресивніше фільтрування, залишаються лише найбільш впевнені бокси, але можливі пропуски коректних детекцій;
Нижчі пороги (наприклад, 0.3 - 0.4): зберігається більше перекривних боксів, що корисно у переповнених сценах, але може збільшити кількість хибнопозитивних результатів.
Використання оптимізованих реалізацій, таких як вбудовані функції NMS у TensorFlow або OpenCV, допомагає прискорити обробку для задач реального часу.
Non-Max Suppression — ключова техніка в задачах детекції об'єктів для видалення надлишкових обмежувальних боксів і підвищення точності моделі. Стандартний NMS ефективно усуває дублікати детекцій, а Soft-NMS удосконалює процес, коригуючи значення довіри замість повного видалення. Тонке налаштування порогів IoU дозволяє досягти оптимального балансу між точністю детекції та обчислювальною ефективністю.
1. Яка основна мета Non-Max Suppression (NMS) у задачах детекції об'єктів?
2. Як стандартний NMS визначає, які обмежувальні рамки потрібно придушити?
3. У чому ключова відмінність між стандартним NMS та Soft-NMS?
Дякуємо за ваш відгук!