Oppiskele Konvoluutiokerrokset | Konvoluutioneuroverkot

Pyyhkäise näyttääksesi valikon

Konvoluutiokerrosten ymmärtäminen

Konvoluutiokerrokset ovat konvoluutioneuroverkkojen (CNN) ydin. Ne suorittavat konvoluution, jossa pieni matriisi, nimeltään suodin (tai ydin), liikkuu kuvan yli tunnistaen reunoja, tekstuureja ja muotoja. Tämä mahdollistaa CNN-verkkojen tehokkaamman kuvankäsittelyn verrattuna perinteisiin verkkoihin.

Sen sijaan, että koko kuva analysoitaisiin kerralla, CNN:t jakavat sen pienempiin osiin ja tunnistavat piirteitä eri tasoilla. Alkuvaiheen kerrokset tunnistavat yksinkertaisia kuvioita, kuten reunoja, kun taas syvemmät kerrokset havaitsevat monimutkaisempia rakenteita.

Miten konvoluutio toimii

Konvoluutiossa suodin (ydin) liikkuu kuvan yli seuraavin vaihein:

Aseta ydin kuvan vasempaan yläkulmaan.
Suorita alkioittainen kertolasku ytimen ja pikseliarvojen välillä.
Laske tulojen summa tuottaaksesi lähtöpikselin.
Siirrä ydintä askelpituuden (stride) mukaisesti ja toista.
Luo ominaisuuskartta, joka korostaa tunnistettuja kuvioita.

Useat suodattimet auttavat CNN-verkkoja tunnistamaan erilaisia piirteitä, kuten pystysuoria reunoja, kaaria ja tekstuureja.

Suodattimet (ytimet):

Suodattimet ovat keskeisessä roolissa merkityksellisten kuvioiden tunnistamisessa kuvista. Eri tyyppiset suodattimet erikoistuvat tunnistamaan erilaisia piirteitä:

Reunantunnistussuodattimet: tunnistavat objektien rajat havaitsemalla äkilliset intensiteetin muutokset (esim. Sobel-, Prewitt- ja Laplace-suodattimet);
Tekstuurisuodattimet: tunnistavat toistuvia kuvioita, kuten aaltoja tai ruudukoita (esim. Gabor-suodattimet);
Terävöityssuodattimet: korostavat kuvan yksityiskohtia vahvistamalla korkeataajuisia komponentteja;
Sumennussuodattimet: vähentävät kohinaa ja pehmentävät kuvia (esim. Gaussinen sumennussuodatin);
Kohokuviointisuodattimet: korostavat reunoja ja lisäävät kolmiulotteisen vaikutelman syvyyttä painottamalla.

Jokainen suodatin opetetaan tunnistamaan tiettyjä kuvioita ja osallistuu hierarkkisten piirre-esitysten rakentamiseen syvissä CNN-malleissa.

Konvoluutiokerrokset käyttävät samaa suodatinta koko kuvan alueella, mikä vähentää parametrien määrää ja tekee CNN-malleista tehokkaita. Erikoistuneet paikallisesti yhdistetyt kerrokset käyttävät kuitenkin eri suodattimia eri alueilla tarpeen mukaan.

Konvoluutiokerroksia pinoamalla CNN:t pystyvät havaitsemaan yksityiskohtaisia kuvioita, mikä tekee niistä tehokkaita kuvien luokittelussa, objektien tunnistuksessa ja konenäön tehtävissä.

Hyperparametrit:

Stride: määrittää, kuinka pitkälle suodatin siirtyy jokaisella askeleella;
Padding: lisää pikseleitä tuloskoon hallitsemiseksi ("same padding" säilyttää koon, "valid padding" pienentää sitä);
Suodattimien määrä (syvyys): useammat suodattimet parantavat piirteiden tunnistusta, mutta lisäävät laskentatehoa.

Huom

Esimerkki: 24×24-kokoinen harmaasävykuva, jossa käytetään 3×3-ydintä ja 64 filters suodatinta, tuottaa ulostulon koon 22×22×64, joka lasketaan seuraavasti:

(W - F + 1) \times (H - F + 1) \times D =\\= (24 - 3 + 1) \times (24 - 3 + 1) \times 64 =\\= 22\times22\times64,

Missä:

$W$ : syötekuvan leveys = 24;
$H$ : syötekuvan korkeus = 24;
$F$ : suodattimen (ytimen) koko = 3 (oletetaan neliömäinen 3×3-ydin);
$D$ : suodattimien määrä (ulostulon syvyys) = 64.

Ennen seuraavaa lukua

Vaikka konvoluutiokerrokset voivat pienentää ulostulon kokoa, niiden ensisijainen tarkoitus on piirteiden erottelu, ei ulottuvuuden pienentäminen. Pooling-kerrokset puolestaan vähentävät ulottuvuutta säilyttäen tärkeät tiedot, mikä varmistaa tehokkuuden syvemmillä kerroksilla.