Kurssisisältö
Konenäön Perusteet
Konenäön Perusteet
Konvoluutiokerrokset
Konvoluutiokerrosten ymmärtäminen
Konvoluutiokerrokset muodostavat konvoluutioneuroverkkojen (CNN) ytimen. Niissä käytetään konvoluutiota, jossa pieni matriisi, nimeltään suodin (tai ydin), liikkuu kuvan yli tunnistaen reunoja, tekstuureja ja muotoja. Tämä mahdollistaa CNN-verkkojen tehokkaamman kuvankäsittelyn verrattuna perinteisiin verkkoihin.
Sen sijaan, että koko kuva analysoitaisiin kerralla, CNN-verkot jakavat sen pienempiin osiin ja tunnistavat piirteitä eri tasoilla. Alkukerrokset tunnistavat yksinkertaisia kuvioita, kuten reunoja, kun taas syvemmät kerrokset havaitsevat monimutkaisempia rakenteita.
Miten konvoluutio toimii
Konvoluutiossa suodin (ydin) liikkuu kuvan yli seuraavin vaihein:
Aseta ydin kuvan vasempaan yläkulmaan.
Suorita alkioittainen kertolasku ytimen ja pikseliarvojen välillä.
Laske tulot yhteen tuottaaksesi lähtöpikselin.
Siirrä ydintä askelpituuden (stride) mukaisesti ja toista.
Luo ominaisuuskartta, joka korostaa tunnistettuja kuvioita.
Useat suotimet auttavat CNN-verkkoja tunnistamaan erilaisia piirteitä, kuten pystysuoria reunoja, kaaria ja tekstuureja.
Suotimet (ytimet):
Suotimet ovat keskeisessä roolissa merkityksellisten kuvioiden tunnistamisessa kuvista. Eri suodintyypit erikoistuvat tunnistamaan erilaisia piirteitä:
Reunantunnistussuotimet: tunnistavat objektien rajat havaitsemalla äkilliset intensiteetin muutokset (esim. Sobel-, Prewitt- ja Laplace-suodattimet);
Tekstuurisuotimet: havaitsevat toistuvia kuvioita, kuten aaltoja tai ruudukoita (esim. Gabor-suodattimet);
Terävöityssuotimet: korostavat kuvan yksityiskohtia vahvistamalla korkeataajuisia komponentteja;
Sumennussuotimet: vähentävät kohinaa ja pehmentävät kuvia (esim. Gaussinen sumennussuodatin);
Kohokuviointisuotimet: korostavat reunoja ja lisäävät 3D-vaikutelman tuomalla esiin syvyyttä.
Jokainen suodin opetetaan tunnistamaan tiettyjä kuvioita ja osallistuu hierarkkisten piirre-esitysten rakentamiseen syvissä konvoluutioverkoissa.
Konvoluutiokerrokset käyttävät samaa suodinta koko kuvan alueella, mikä vähentää parametrien määrää ja tekee CNN-malleista tehokkaita. Tarvittaessa erikoistuneet paikallisesti kytketyt kerrokset käyttävät eri suotimia eri alueilla.
Konvoluutiokerroksia pinoamalla CNN:t pystyvät tunnistamaan yksityiskohtaisia kuvioita, mikä tekee niistä tehokkaita kuvien luokittelussa, objektien tunnistuksessa ja konenäön tehtävissä.
Hyperparametrit:
Askelväli (stride): määrittää, kuinka pitkälle suodin siirtyy kerrallaan;
Täydennys (padding): lisää pikseleitä tuloksen koon hallitsemiseksi ("same"-täydennys säilyttää koon, "valid"-täydennys pienentää sitä);
Suotimien määrä (syvyys): useampi suodin parantaa piirteiden tunnistusta, mutta lisää laskentatehoa.
Ennen seuraavaa lukua, muista:
Vaikka konvoluutiokerrokset voivat pienentää ulostulon kokoa, niiden ensisijainen tarkoitus on piirteiden erottelu, ei ulottuvuuden pienentäminen. Pooling-kerrokset puolestaan vähentävät ulottuvuutta säilyttäen tärkeät tiedot, mikä tehostaa syvempiä kerroksia.
1. Mikä on konvoluutiokerroksen ensisijainen tehtävä CNN:ssä?
2. Mikä hyperparametri määrittää, kuinka pitkälle suodatin siirtyy konvoluution aikana?
3. Mikä on useiden suodattimien käyttämisen tarkoitus konvoluutiokerroksessa?
Kiitos palautteestasi!