Шари Згортки
Свайпніть щоб показати меню
Шари згортки є основою згорткових нейронних мереж (CNN). Вони виконують згортку, під час якої невелика матриця, що називається фільтром (або ядром), переміщується по зображенню для виявлення країв, текстур і форм. Це дозволяє CNN обробляти зображення ефективніше, ніж традиційні мережі.
Замість аналізу всього зображення одразу, CNN розбиває його на менші ділянки, виявляючи ознаки на різних рівнях. Початкові шари розпізнають прості шаблони, такі як краї, а глибші шари виявляють складні структури.
Як працює згортка
Згортка передбачає переміщення фільтра (ядра) по зображенню за такими кроками:
- Застосування ядра у верхньому лівому куті зображення;
- Поелементне множення між ядром і значеннями пікселів;
- Сума добутків для отримання вихідного пікселя;
- Переміщення ядра згідно зі кроком (stride) та повторення операції;
- Створення карти ознак, яка підкреслює виявлені шаблони.
Кілька фільтрів дозволяють згортковим нейронним мережам (CNN) виявляти різні ознаки, такі як вертикальні краї, криві та текстури.
Фільтри (ядра):
Фільтри відіграють ключову роль у виділенні значущих шаблонів із зображень. Різні типи фільтрів спеціалізуються на виявленні різних ознак:
- Фільтри для виявлення країв: ідентифікують межі об'єктів шляхом виявлення різких змін інтенсивності (наприклад, фільтри Собеля, Прюітта та Лапласа);
- Фільтри текстур: фіксують повторювані візерунки, такі як хвилі або сітки (наприклад, фільтри Габора);
- Фільтри підвищення різкості: підсилюють деталі зображення шляхом посилення високочастотних компонентів;
- Фільтри розмиття: зменшують шум і згладжують зображення (наприклад, фільтр Гаусового розмиття);
- Фільтри тиснення: підкреслюють краї та додають 3D-ефект, акцентуючи глибину.
Кожен фільтр навчається виявляти певні шаблони та сприяє формуванню ієрархічних ознак у глибоких згорткових нейронних мережах (CNN).
Згорткові шари використовують один і той самий фільтр для всього зображення, що зменшує кількість параметрів і підвищує ефективність CNN. Однак спеціалізовані локально зв'язані шари застосовують різні фільтри для різних областей, коли це необхідно.
Шляхом послідовного розташування згорткових шарів CNN виділяють детальні шаблони, що робить їх потужними для класифікації зображень, виявлення об'єктів та інших завдань комп'ютерного зору.
Гіперпараметри:
- Крок (stride): визначає, на яку відстань фільтр пересувається за один крок;
- Доповнення (padding): додає пікселі для контролю розміру вихідних даних (same padding зберігає розмір, valid padding його зменшує);
- Кількість фільтрів (глибина): більша кількість фільтрів покращує виявлення ознак, але збільшує обчислювальні витрати.
Example: For a 24×24 grayscale image using a 3×3 kernel with 64 filters, the output size is 22×22×64, computed as:
Where:
- W: width of the input image = 24;
- H: height of the input image = 24;
- F: size of the filter (kernel) = 3 (assuming a square 3×3 kernel);
- D: number of filters (depth of the output) = 64.
Перед наступним розділом
Хоча шари згортки можуть зменшувати розмір вихідних даних, їх основна мета — виділення ознак, а не зменшення розмірності. Шари пулінгу, навпаки, явно зменшують розмірність, зберігаючи важливу інформацію та забезпечуючи ефективність у глибших шарах.
1. Яка основна роль шару згортки у згортковій нейронній мережі (CNN)?
2. Який гіперпараметр визначає, наскільки далеко фільтр рухається під час згортки?
3. Яка мета застосування декількох фільтрів у шарі згортки?
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат