Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Огляд Моделі YOLO | Виявлення Об'єктів
Основи Комп'ютерного Зору
course content

Зміст курсу

Основи Комп'ютерного Зору

Основи Комп'ютерного Зору

1. Вступ до Комп'ютерного Зору
2. Обробка Зображень з OpenCV
3. Згорткові Нейронні Мережі
4. Виявлення Об'єктів
5. Огляд Розширених Тем

book
Огляд Моделі YOLO

Алгоритм YOLO (You Only Look Once) — це швидка та ефективна модель для виявлення об'єктів. На відміну від традиційних підходів, таких як R-CNN, які використовують кілька етапів, YOLO обробляє все зображення за один прохід, що робить його ідеальним для застосування в реальному часі.

Відмінності YOLO від підходів R-CNN

Традиційні методи виявлення об'єктів, такі як R-CNN та його варіанти, використовують двоступеневий конвеєр: спочатку генеруються регіональні пропозиції, а потім класифікується кожна запропонована область. Хоча цей підхід є ефективним, він вимагає значних обчислювальних ресурсів і уповільнює процес інференсу, що робить його менш придатним для застосування в реальному часі.

YOLO (You Only Look Once) застосовує принципово інший підхід. Він ділить вхідне зображення на ґратку та прогнозує координати обмежувальних рамок і ймовірності класів для кожної клітини за один прямий прохід. Така архітектура розглядає задачу виявлення об'єктів як єдину задачу регресії, що дозволяє YOLO досягати продуктивності в реальному часі.

На відміну від методів на основі R-CNN, які зосереджуються лише на локальних ділянках, YOLO обробляє все зображення одночасно, що дозволяє враховувати глобальний контекст. Це забезпечує кращу ефективність при виявленні декількох або перекриваючихся об'єктів, зберігаючи високу швидкість та точність.

Архітектура YOLO та прогнозування на основі ґратки

YOLO розбиває вхідне зображення на ґратку розміром S × S, де кожна клітина відповідає за виявлення об'єктів, центр яких знаходиться всередині неї. Кожна клітина прогнозує координати обмежувальної рамки (x, y, ширина, висота), оцінку впевненості щодо наявності об'єкта та ймовірності класів. Оскільки YOLO обробляє все зображення за один прямий прохід, він є надзвичайно ефективним у порівнянні з попередніми моделями для виявлення об'єктів.

Функція втрат і оцінки впевненості класу

YOLO оптимізує точність виявлення за допомогою спеціальної функції втрат, яка включає:

  • Втрати локалізації: вимірюють точність обмежувальних рамок;

  • Втрати впевненості: гарантують, що передбачення правильно вказують наявність об'єкта;

  • Втрати класифікації: оцінюють, наскільки добре передбачений клас відповідає істинному класу.

Для покращення результатів YOLO застосовує якорні рамки та пригнічення немаксимальних значень (NMS) для видалення надлишкових виявлень.

Переваги YOLO: компроміс між швидкістю та точністю

Головна перевага YOLO — швидкість. Оскільки виявлення відбувається за один прохід, YOLO значно швидший за методи на основі R-CNN, що робить його придатним для задач реального часу, таких як автономне керування та відеоспостереження. Проте ранні версії YOLO мали труднощі з виявленням дрібних об'єктів, що було покращено у наступних версіях.

YOLO: коротка історія

YOLO, розроблений Джозефом Редмоном та Алі Фархаді у 2015 році, змінив підхід до виявлення об'єктів завдяки обробці за один прохід.

  • YOLOv2 (2016): додано пакетну нормалізацію, якорні рамки та кластеризацію розмірів;

  • YOLOv3 (2018): впроваджено ефективніший бекбон, кілька якорів та просторове пірамідальне пулінгування;

  • YOLOv4 (2020): додано мозаїчну аугментацію даних, безякорну голову виявлення та нову функцію втрат;

  • YOLOv5: підвищено продуктивність завдяки оптимізації гіперпараметрів, відстеженню експериментів та автоматичному експорту;

  • YOLOv6 (2022): відкритий код компанією Meituan, використовується в автономних роботах-доставниках;

  • YOLOv7: розширено можливості, включено оцінку поз;

  • YOLOv8 (2023): покращено швидкість, гнучкість та ефективність для задач комп'ютерного зору;

  • YOLOv9: впроваджено Програмовану Градієнтну Інформацію (PGI) та Універсальну Ефективну Мережу Агрегації Шарів (GELAN);

  • YOLOv10: розроблений університетом Цінхуа, усунено пригнічення немаксимальних значень (NMS) завдяки голові виявлення End-to-End;

  • YOLOv11: найновіша модель з найкращими показниками у виявленні об'єктів, сегментації та класифікації.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 7

Запитати АІ

expand
ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

course content

Зміст курсу

Основи Комп'ютерного Зору

Основи Комп'ютерного Зору

1. Вступ до Комп'ютерного Зору
2. Обробка Зображень з OpenCV
3. Згорткові Нейронні Мережі
4. Виявлення Об'єктів
5. Огляд Розширених Тем

book
Огляд Моделі YOLO

Алгоритм YOLO (You Only Look Once) — це швидка та ефективна модель для виявлення об'єктів. На відміну від традиційних підходів, таких як R-CNN, які використовують кілька етапів, YOLO обробляє все зображення за один прохід, що робить його ідеальним для застосування в реальному часі.

Відмінності YOLO від підходів R-CNN

Традиційні методи виявлення об'єктів, такі як R-CNN та його варіанти, використовують двоступеневий конвеєр: спочатку генеруються регіональні пропозиції, а потім класифікується кожна запропонована область. Хоча цей підхід є ефективним, він вимагає значних обчислювальних ресурсів і уповільнює процес інференсу, що робить його менш придатним для застосування в реальному часі.

YOLO (You Only Look Once) застосовує принципово інший підхід. Він ділить вхідне зображення на ґратку та прогнозує координати обмежувальних рамок і ймовірності класів для кожної клітини за один прямий прохід. Така архітектура розглядає задачу виявлення об'єктів як єдину задачу регресії, що дозволяє YOLO досягати продуктивності в реальному часі.

На відміну від методів на основі R-CNN, які зосереджуються лише на локальних ділянках, YOLO обробляє все зображення одночасно, що дозволяє враховувати глобальний контекст. Це забезпечує кращу ефективність при виявленні декількох або перекриваючихся об'єктів, зберігаючи високу швидкість та точність.

Архітектура YOLO та прогнозування на основі ґратки

YOLO розбиває вхідне зображення на ґратку розміром S × S, де кожна клітина відповідає за виявлення об'єктів, центр яких знаходиться всередині неї. Кожна клітина прогнозує координати обмежувальної рамки (x, y, ширина, висота), оцінку впевненості щодо наявності об'єкта та ймовірності класів. Оскільки YOLO обробляє все зображення за один прямий прохід, він є надзвичайно ефективним у порівнянні з попередніми моделями для виявлення об'єктів.

Функція втрат і оцінки впевненості класу

YOLO оптимізує точність виявлення за допомогою спеціальної функції втрат, яка включає:

  • Втрати локалізації: вимірюють точність обмежувальних рамок;

  • Втрати впевненості: гарантують, що передбачення правильно вказують наявність об'єкта;

  • Втрати класифікації: оцінюють, наскільки добре передбачений клас відповідає істинному класу.

Для покращення результатів YOLO застосовує якорні рамки та пригнічення немаксимальних значень (NMS) для видалення надлишкових виявлень.

Переваги YOLO: компроміс між швидкістю та точністю

Головна перевага YOLO — швидкість. Оскільки виявлення відбувається за один прохід, YOLO значно швидший за методи на основі R-CNN, що робить його придатним для задач реального часу, таких як автономне керування та відеоспостереження. Проте ранні версії YOLO мали труднощі з виявленням дрібних об'єктів, що було покращено у наступних версіях.

YOLO: коротка історія

YOLO, розроблений Джозефом Редмоном та Алі Фархаді у 2015 році, змінив підхід до виявлення об'єктів завдяки обробці за один прохід.

  • YOLOv2 (2016): додано пакетну нормалізацію, якорні рамки та кластеризацію розмірів;

  • YOLOv3 (2018): впроваджено ефективніший бекбон, кілька якорів та просторове пірамідальне пулінгування;

  • YOLOv4 (2020): додано мозаїчну аугментацію даних, безякорну голову виявлення та нову функцію втрат;

  • YOLOv5: підвищено продуктивність завдяки оптимізації гіперпараметрів, відстеженню експериментів та автоматичному експорту;

  • YOLOv6 (2022): відкритий код компанією Meituan, використовується в автономних роботах-доставниках;

  • YOLOv7: розширено можливості, включено оцінку поз;

  • YOLOv8 (2023): покращено швидкість, гнучкість та ефективність для задач комп'ютерного зору;

  • YOLOv9: впроваджено Програмовану Градієнтну Інформацію (PGI) та Універсальну Ефективну Мережу Агрегації Шарів (GELAN);

  • YOLOv10: розроблений університетом Цінхуа, усунено пригнічення немаксимальних значень (NMS) завдяки голові виявлення End-to-End;

  • YOLOv11: найновіша модель з найкращими показниками у виявленні об'єктів, сегментації та класифікації.

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 7
Ми дуже хвилюємося, що щось пішло не так. Що трапилося?
some-alt