Огляд Моделі YOLO
Свайпніть щоб показати меню
Алгоритм YOLO (You Only Look Once) — це швидка та ефективна модель для виявлення об'єктів. На відміну від традиційних підходів, таких як R-CNN, які використовують кілька етапів, YOLO обробляє все зображення за один прохід, що робить його ідеальним для застосування в реальному часі.
Чим YOLO відрізняється від підходів R-CNN
Традиційні методи виявлення об'єктів, такі як R-CNN та його варіанти, використовують двоступеневий конвеєр: спочатку генерують регіональні пропозиції, а потім класифікують кожну запропоновану область. Хоча цей підхід ефективний, він є обчислювально затратним і уповільнює процес інференсу, що робить його менш придатним для застосування в реальному часі.
YOLO (You Only Look Once) застосовує принципово інший підхід. Він розбиває вхідне зображення на ґратку та прогнозує координати обмежувальних рамок і ймовірності класів для кожної клітини за один прямий прохід. Такий підхід розглядає задачу виявлення об'єктів як єдину задачу регресії, що дозволяє YOLO досягати продуктивності в реальному часі.
На відміну від методів на основі R-CNN, які фокусуються лише на локальних ділянках, YOLO обробляє все зображення одночасно, що дозволяє враховувати глобальний контекст. Це забезпечує кращу ефективність при виявленні декількох або перекриваючихся об'єктів, зберігаючи високу швидкість і точність.
Архітектура YOLO та прогнозування на основі ґратки
YOLO розбиває вхідне зображення на ґратку S × S, де кожна клітина відповідає за виявлення об'єктів, центр яких потрапляє в цю клітину. Кожна клітина прогнозує координати обмежувальної рамки (x, y, ширина, висота), коефіцієнт впевненості та ймовірності класів. Оскільки YOLO обробляє все зображення за один прямий прохід, він є надзвичайно ефективним у порівнянні з попередніми моделями для виявлення об'єктів.
Функція втрат і оцінки впевненості класу
YOLO оптимізує точність виявлення за допомогою спеціальної функції втрат, яка включає:
- Втрати локалізації: вимірюють точність обмежувальних рамок;
- Втрати впевненості: гарантують, що передбачення правильно вказують наявність об'єкта;
- Втрати класифікації: оцінюють, наскільки добре передбачений клас відповідає істинному класу.
Для покращення результатів YOLO застосовує якорні рамки та пригнічення немаксимальних значень (NMS) для усунення надлишкових виявлень.
Переваги YOLO: компроміс між швидкістю та точністю
Головна перевага YOLO — це швидкість. Оскільки виявлення відбувається за один прохід, YOLO значно швидший за методи на основі R-CNN, що робить його придатним для задач реального часу, таких як автономне керування та відеоспостереження. Проте ранні версії YOLO мали труднощі з виявленням малих об'єктів, що було покращено у наступних версіях.
YOLO: Коротка історія
YOLO, розроблений Джозефом Редмоном та Алі Фархаді у 2015 році, здійснив революцію у виявленні об'єктів завдяки одноразовій обробці зображення.
- YOLOv2 (2016): додано пакетну нормалізацію, якірні бокси та кластери розмірів;
- YOLOv3 (2018): впроваджено ефективніший бекбон, декілька якірів та просторове пірамідальне пулінгування;
- YOLOv4 (2020): додано мозаїчну аугментацію даних, детектор без якірів та нову функцію втрат;
- YOLOv5: підвищено продуктивність завдяки оптимізації гіперпараметрів, відстеженню експериментів та автоматичному експорту;
- YOLOv6 (2022): відкритий код від Meituan, використовується в автономних роботах-доставниках;
- YOLOv7: розширено можливості для оцінки поз;
- YOLOv8 (2023): покращено швидкість, гнучкість та ефективність для завдань комп'ютерного зору;
- YOLOv9: впроваджено Програмовану Градієнтну Інформацію (PGI) та Універсальну Ефективну Мережу Агрегації Шарів (GELAN);
- YOLOv10: розроблено університетом Цінхуа, усунено Non-Maximum Suppression (NMS) завдяки детектору з кінця в кінець;
- YOLOv11: найновіша модель з передовою продуктивністю у виявленні об'єктів, сегментації та класифікації.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат