Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Приглушення Немаксимальних Значень (NMS) | Виявлення Об'єктів
Основи Комп'ютерного Зору
course content

Зміст курсу

Основи Комп'ютерного Зору

Основи Комп'ютерного Зору

1. Вступ до Комп'ютерного Зору
2. Обробка Зображень з OpenCV
3. Згорткові Нейронні Мережі
4. Виявлення Об'єктів
5. Огляд Розширених Тем

book
Приглушення Немаксимальних Значень (NMS)

Моделі виявлення об'єктів часто прогнозують кілька перекривних обмежувальних рамок для одного й того ж об'єкта. Це відбувається тому, що моделі сканують зображення на різних масштабах і позиціях, що призводить до надлишкових передбачень. Non-Max Suppression (NMS) — це важливий етап постобробки, який уточнює ці виявлення, обираючи найбільш релевантні обмежувальні рамки та відкидаючи зайві.

Чому виникають кілька перекривних рамок

Детектори об'єктів прогнозують кілька обмежувальних рамок для одного об'єкта через:

  • Якірні рамки: деякі моделі, такі як Faster R-CNN та YOLO, використовують заздалегідь визначені якорі різних розмірів, що призводить до кількох виявлень одного й того ж об'єкта;

  • Підхід ковзного вікна: деякі методи виявлення сканують зображення невеликими регіонами, що спричиняє повторні виявлення об'єкта в перекривних областях;

  • Високі оцінки впевненості: модель призначає кожному передбаченню оцінку впевненості, і схожі передбачення з високою впевненістю можуть значно перекриватися.

Якщо ці надлишкові рамки не відфільтрувати, це може негативно вплинути на продуктивність виявлення об'єктів, збільшуючи обчислювальну складність і роблячи підрахунок об'єктів ненадійним.

Як працює Non-Max Suppression

NMS застосовується для видалення дубльованих виявлень, залишаючи найбільш впевнену обмежувальну рамку. Основні етапи:

  • Сортування за оцінкою: впорядкувати всі передбачені обмежувальні рамки у спадному порядку за їхніми оцінками впевненості;

  • Вибір найкращої рамки: обрати рамку з найвищою оцінкою та додати її до фінального списку виявлень;

  • Обчислення IoU: розрахувати Intersection Over Union (IoU) між вибраною рамкою та всіма іншими, що залишилися;

  • Поріг: придушити (видалити) рамки, які мають IoU вище заданого порогу (наприклад, 0.5), оскільки вони, ймовірно, представляють той самий об'єкт;

  • Повторення: продовжувати цей процес для наступної рамки з найвищою оцінкою, доки всі рамки не будуть оброблені.

Soft-NMS: розумніша альтернатива

Стандартний NMS видаляє всі перекривні бокси, які перевищують певний поріг IoU, що іноді може призвести до втрати корисних детекцій. Soft-NMS удосконалює цей підхід, зменшуючи значення довіри перекривних боксів замість їх повного видалення. Такий метод забезпечує більш плавний процес придушення та може підвищити якість детекції у щільних сценах.

Основні відмінності між стандартним NMS та Soft-NMS:

  • Стандартний NMS: видаляє перекривні бокси, що перевищують поріг IoU;

  • Soft-NMS: зменшує значення довіри перекривних боксів замість їх видалення, що робить його більш гнучким для виявлення частково перекритих об'єктів.

Балансування точності та швидкості в NMS

Вибір правильного порогу IoU є критичним:

  • Вищі пороги (наприклад, 0.6 - 0.7): агресивніше фільтрування, залишаються лише найбільш впевнені бокси, але можливі пропуски коректних детекцій;

  • Нижчі пороги (наприклад, 0.3 - 0.4): зберігається більше перекривних боксів, що корисно у переповнених сценах, але може збільшити кількість хибнопозитивних результатів.

Використання оптимізованих реалізацій, таких як вбудовані функції NMS у TensorFlow або OpenCV, допомагає прискорити обробку для задач реального часу.

Non-Max Suppression — ключова техніка в задачах детекції об'єктів для видалення надлишкових обмежувальних боксів і підвищення точності моделі. Стандартний NMS ефективно усуває дублікати детекцій, а Soft-NMS удосконалює процес, коригуючи значення довіри замість повного видалення. Тонке налаштування порогів IoU дозволяє досягти оптимального балансу між точністю детекції та обчислювальною ефективністю.

1. Яка основна мета Non-Max Suppression (NMS) у задачах детекції об'єктів?

2. Як стандартний NMS визначає, які обмежувальні рамки потрібно придушити?

3. У чому ключова відмінність між стандартним NMS та Soft-NMS?

question mark

Яка основна мета Non-Max Suppression (NMS) у задачах детекції об'єктів?

Select the correct answer

question mark

Як стандартний NMS визначає, які обмежувальні рамки потрібно придушити?

Select the correct answer

question mark

У чому ключова відмінність між стандартним NMS та Soft-NMS?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 5

Запитати АІ

expand
ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

course content

Зміст курсу

Основи Комп'ютерного Зору

Основи Комп'ютерного Зору

1. Вступ до Комп'ютерного Зору
2. Обробка Зображень з OpenCV
3. Згорткові Нейронні Мережі
4. Виявлення Об'єктів
5. Огляд Розширених Тем

book
Приглушення Немаксимальних Значень (NMS)

Моделі виявлення об'єктів часто прогнозують кілька перекривних обмежувальних рамок для одного й того ж об'єкта. Це відбувається тому, що моделі сканують зображення на різних масштабах і позиціях, що призводить до надлишкових передбачень. Non-Max Suppression (NMS) — це важливий етап постобробки, який уточнює ці виявлення, обираючи найбільш релевантні обмежувальні рамки та відкидаючи зайві.

Чому виникають кілька перекривних рамок

Детектори об'єктів прогнозують кілька обмежувальних рамок для одного об'єкта через:

  • Якірні рамки: деякі моделі, такі як Faster R-CNN та YOLO, використовують заздалегідь визначені якорі різних розмірів, що призводить до кількох виявлень одного й того ж об'єкта;

  • Підхід ковзного вікна: деякі методи виявлення сканують зображення невеликими регіонами, що спричиняє повторні виявлення об'єкта в перекривних областях;

  • Високі оцінки впевненості: модель призначає кожному передбаченню оцінку впевненості, і схожі передбачення з високою впевненістю можуть значно перекриватися.

Якщо ці надлишкові рамки не відфільтрувати, це може негативно вплинути на продуктивність виявлення об'єктів, збільшуючи обчислювальну складність і роблячи підрахунок об'єктів ненадійним.

Як працює Non-Max Suppression

NMS застосовується для видалення дубльованих виявлень, залишаючи найбільш впевнену обмежувальну рамку. Основні етапи:

  • Сортування за оцінкою: впорядкувати всі передбачені обмежувальні рамки у спадному порядку за їхніми оцінками впевненості;

  • Вибір найкращої рамки: обрати рамку з найвищою оцінкою та додати її до фінального списку виявлень;

  • Обчислення IoU: розрахувати Intersection Over Union (IoU) між вибраною рамкою та всіма іншими, що залишилися;

  • Поріг: придушити (видалити) рамки, які мають IoU вище заданого порогу (наприклад, 0.5), оскільки вони, ймовірно, представляють той самий об'єкт;

  • Повторення: продовжувати цей процес для наступної рамки з найвищою оцінкою, доки всі рамки не будуть оброблені.

Soft-NMS: розумніша альтернатива

Стандартний NMS видаляє всі перекривні бокси, які перевищують певний поріг IoU, що іноді може призвести до втрати корисних детекцій. Soft-NMS удосконалює цей підхід, зменшуючи значення довіри перекривних боксів замість їх повного видалення. Такий метод забезпечує більш плавний процес придушення та може підвищити якість детекції у щільних сценах.

Основні відмінності між стандартним NMS та Soft-NMS:

  • Стандартний NMS: видаляє перекривні бокси, що перевищують поріг IoU;

  • Soft-NMS: зменшує значення довіри перекривних боксів замість їх видалення, що робить його більш гнучким для виявлення частково перекритих об'єктів.

Балансування точності та швидкості в NMS

Вибір правильного порогу IoU є критичним:

  • Вищі пороги (наприклад, 0.6 - 0.7): агресивніше фільтрування, залишаються лише найбільш впевнені бокси, але можливі пропуски коректних детекцій;

  • Нижчі пороги (наприклад, 0.3 - 0.4): зберігається більше перекривних боксів, що корисно у переповнених сценах, але може збільшити кількість хибнопозитивних результатів.

Використання оптимізованих реалізацій, таких як вбудовані функції NMS у TensorFlow або OpenCV, допомагає прискорити обробку для задач реального часу.

Non-Max Suppression — ключова техніка в задачах детекції об'єктів для видалення надлишкових обмежувальних боксів і підвищення точності моделі. Стандартний NMS ефективно усуває дублікати детекцій, а Soft-NMS удосконалює процес, коригуючи значення довіри замість повного видалення. Тонке налаштування порогів IoU дозволяє досягти оптимального балансу між точністю детекції та обчислювальною ефективністю.

1. Яка основна мета Non-Max Suppression (NMS) у задачах детекції об'єктів?

2. Як стандартний NMS визначає, які обмежувальні рамки потрібно придушити?

3. У чому ключова відмінність між стандартним NMS та Soft-NMS?

question mark

Яка основна мета Non-Max Suppression (NMS) у задачах детекції об'єктів?

Select the correct answer

question mark

Як стандартний NMS визначає, які обмежувальні рамки потрібно придушити?

Select the correct answer

question mark

У чому ключова відмінність між стандартним NMS та Soft-NMS?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 5
Ми дуже хвилюємося, що щось пішло не так. Що трапилося?
some-alt