Зміст курсу
Основи Комп'ютерного Зору
Основи Комп'ютерного Зору
Шари Згортки
Розуміння шарів згортки
Шари згортки є основою згорткових нейронних мереж (CNN). Вони виконують згортку, під час якої невелика матриця, що називається фільтром (або ядром), переміщується по зображенню для виявлення країв, текстур і форм. Це дозволяє CNN ефективніше обробляти зображення порівняно з традиційними мережами.
Замість аналізу всього зображення одразу, CNN розбиває його на менші ділянки, виявляючи ознаки на різних рівнях. Початкові шари розпізнають прості шаблони, такі як краї, тоді як глибші шари виявляють складні структури.
Як працює згортка
Згортка передбачає переміщення фільтра (ядра) по зображенню за такими кроками:
Застосування ядра у верхньому лівому куті зображення.
Поелементне множення між ядром і значеннями пікселів.
Сума добутків для отримання вихідного пікселя.
Переміщення ядра згідно зі кроком (stride) та повторення операції.
Створення карти ознак, яка підкреслює виявлені шаблони.
Кілька фільтрів дозволяють CNN виявляти різні ознаки, такі як вертикальні краї, криві та текстури.
Фільтри (ядра):
Фільтри відіграють ключову роль у виділенні значущих шаблонів зображень. Різні типи фільтрів спеціалізуються на виявленні різних ознак:
Фільтри для виявлення країв: визначають межі об'єктів шляхом виявлення різких змін інтенсивності (наприклад, фільтри Собеля, Прюітта та Лапласа);
Фільтри текстур: фіксують повторювані візерунки, такі як хвилі або сітки (наприклад, фільтри Габора);
Фільтри підвищення різкості: підсилюють деталі зображення шляхом посилення високочастотних компонентів;
Фільтри розмиття: зменшують шум і згладжують зображення (наприклад, фільтр Гауса);
Фільтри тиснення: підкреслюють краї та додають 3D-ефект, акцентуючи глибину.
Кожен фільтр навчається виявляти певні шаблони та сприяє формуванню ієрархічних уявлень ознак у глибоких згорткових нейронних мережах.
Згорткові шари використовують один і той самий фільтр для всього зображення, що зменшує кількість параметрів і підвищує ефективність CNN. Однак спеціалізовані локально з'єднані шари застосовують різні фільтри для різних ділянок за потреби.
Шляхом послідовного застосування згорткових шарів CNN виділяють детальні шаблони, що робить їх потужними для класифікації зображень, виявлення об'єктів та інших завдань комп'ютерного зору.
Гіперпараметри:
Крок (stride): визначає, на яку відстань фільтр переміщується за один крок;
Доповнення (padding): додає пікселі для контролю розміру вихідних даних (same padding зберігає розмір, valid padding його зменшує);
Кількість фільтрів (глибина): більша кількість фільтрів покращує виявлення ознак, але збільшує обчислювальні витрати.
Перед наступною главою слід пам’ятати:
Хоча шари згортки можуть зменшувати розмір вихідних даних, їх основна мета — виділення ознак, а не зменшення розмірності. Шари пулінгу, навпаки, спеціально зменшують розмірність, зберігаючи важливу інформацію, що забезпечує ефективність у глибших шарах.
1. Яка основна роль шару згортки у згортковій нейронній мережі?
2. Який гіперпараметр визначає, наскільки далеко фільтр рухається під час згортки?
3. Яка мета застосування кількох фільтрів у шарі згортки?
Дякуємо за ваш відгук!