Свайпніть щоб показати меню

Алгоритм YOLO (You Only Look Once) — це швидка та ефективна модель для виявлення об'єктів. На відміну від традиційних підходів, таких як R-CNN, які використовують кілька етапів, YOLO обробляє все зображення за один прохід, що робить його ідеальним для застосування в реальному часі.

Чим YOLO відрізняється від підходів R-CNN

Традиційні методи виявлення об'єктів, такі як R-CNN та його варіанти, використовують двоступеневий конвеєр: спочатку генерують регіональні пропозиції, а потім класифікують кожну запропоновану область. Хоча цей підхід ефективний, він є обчислювально затратним і уповільнює процес інференсу, що робить його менш придатним для застосування в реальному часі.

YOLO (You Only Look Once) застосовує принципово інший підхід. Він розбиває вхідне зображення на ґратку та прогнозує координати обмежувальних рамок і ймовірності класів для кожної клітини за один прямий прохід. Такий підхід розглядає задачу виявлення об'єктів як єдину задачу регресії, що дозволяє YOLO досягати продуктивності в реальному часі.

На відміну від методів на основі R-CNN, які фокусуються лише на локальних ділянках, YOLO обробляє все зображення одночасно, що дозволяє враховувати глобальний контекст. Це забезпечує кращу ефективність при виявленні декількох або перекриваючихся об'єктів, зберігаючи високу швидкість і точність.

Архітектура YOLO та прогнозування на основі ґратки

YOLO розбиває вхідне зображення на ґратку S × S, де кожна клітина відповідає за виявлення об'єктів, центр яких потрапляє в цю клітину. Кожна клітина прогнозує координати обмежувальної рамки (x, y, ширина, висота), коефіцієнт впевненості та ймовірності класів. Оскільки YOLO обробляє все зображення за один прямий прохід, він є надзвичайно ефективним у порівнянні з попередніми моделями для виявлення об'єктів.

Функція втрат і оцінки впевненості класу

YOLO оптимізує точність виявлення за допомогою спеціальної функції втрат, яка включає:

Втрати локалізації: вимірюють точність обмежувальних рамок;
Втрати впевненості: гарантують, що передбачення правильно вказують наявність об'єкта;
Втрати класифікації: оцінюють, наскільки добре передбачений клас відповідає істинному класу.

Для покращення результатів YOLO застосовує якорні рамки та пригнічення немаксимальних значень (NMS) для усунення надлишкових виявлень.

Переваги YOLO: компроміс між швидкістю та точністю

Головна перевага YOLO — це швидкість. Оскільки виявлення відбувається за один прохід, YOLO значно швидший за методи на основі R-CNN, що робить його придатним для задач реального часу, таких як автономне керування та відеоспостереження. Проте ранні версії YOLO мали труднощі з виявленням малих об'єктів, що було покращено у наступних версіях.

YOLO: Коротка історія

YOLO, розроблений Джозефом Редмоном та Алі Фархаді у 2015 році, здійснив революцію у виявленні об'єктів завдяки одноразовій обробці зображення.

YOLOv2 (2016): додано пакетну нормалізацію, якірні бокси та кластери розмірів;
YOLOv3 (2018): впроваджено ефективніший бекбон, декілька якірів та просторове пірамідальне пулінгування;
YOLOv4 (2020): додано мозаїчну аугментацію даних, детектор без якірів та нову функцію втрат;
YOLOv5: підвищено продуктивність завдяки оптимізації гіперпараметрів, відстеженню експериментів та автоматичному експорту;
YOLOv6 (2022): відкритий код від Meituan, використовується в автономних роботах-доставниках;
YOLOv7: розширено можливості для оцінки поз;
YOLOv8 (2023): покращено швидкість, гнучкість та ефективність для завдань комп'ютерного зору;
YOLOv9: впроваджено Програмовану Градієнтну Інформацію (PGI) та Універсальну Ефективну Мережу Агрегації Шарів (GELAN);
YOLOv10: розроблено університетом Цінхуа, усунено Non-Maximum Suppression (NMS) завдяки детектору з кінця в кінець;
YOLOv11: найновіша модель з передовою продуктивністю у виявленні об'єктів, сегментації та класифікації.

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 1. Розділ 25

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Огляд Моделі YOLO