Johdanto Konvoluutiohermoverkkoihin
Pyyhkäise näyttääksesi valikon
Mikä on CNN ja miten se eroaa perinteisistä neuroverkoista?
Konvoluutiohermoverkko (CNN) on tekoälyn muoto, joka auttaa tietokoneita "näkemään" ja ymmärtämään kuvia. Toisin kuin tavalliset neuroverkot, jotka käsittelevät kuvia numerosarjoina, CNN:t tarkastelevat kuvia osissa ja tunnistavat kuvioita kuten reunoja, muotoja ja tekstuureja. Tämä tekee niistä huomattavasti parempia käsittelemään kuvia ja videoita.
Miten CNN:t ovat saaneet inspiraationsa ihmisen silmästä
CNN:t toimivat samalla tavalla kuin ihmisaivot käsittelevät kuvia. Kun katsomme jotakin, silmämme lähettävät tietoa aivoihin, jotka ensin tunnistavat yksinkertaisia muotoja kuten reunoja ja värejä. Syvemmät aivokerrokset yhdistävät nämä osat tunnistaakseen esineitä, kasvoja tai kokonaisia kohtauksia. CNN:t noudattavat samaa periaatetta: ne aloittavat yksinkertaisista piirteistä ja rakentavat niistä monimutkaisempia kokonaisuuksia.
Aivan kuten silmämme keskittyvät tiettyihin alueisiin, CNN:tkin käsittelevät kuvia pienissä osissa, mikä auttaa tunnistamaan kuvioita niiden sijainnista riippumatta. Toisin kuin ihmiset, CNN:t kuitenkin tarvitsevat tuhansia nimettyjä kuvia oppiakseen, kun taas ihmiset voivat tunnistaa esineitä nähtyään ne vain muutaman kerran.
Keskeisten osien yleiskatsaus: konvoluutio, pooling, aktivointi ja täysin yhdistetyt kerrokset
CNN koostuu useista kerroksista, joilla jokaisella on oma roolinsa kuvien käsittelyssä:
- Käytetään suodattimia (ytimiä) havaitsemaan kuvioita, kuten reunoja, tekstuureja ja muotoja;
- Hyödynnetään askelpituutta ja täydennystä (stride ja padding) ominaisuuskarttojen mittojen hallintaan;
- Luodaan useita ominaisuuskarttoja syvälliseen piirteiden poimintaan.
- Tuodaan mukaan epälineaarisuutta, mikä mahdollistaa CNN:n oppia monimutkaisia esityksiä;
- Yleisiä funktioita ovat ReLU (Rectified Linear Unit), Leaky ReLU ja Sigmoid.
- Pienennetään ominaisuuskarttojen spatiaalista kokoa säilyttäen tärkeä informaatio;
- Tyyppejä ovat maksimipoolaus (tallentaa hallitsevat piirteet) ja keskiarvopoolaus (tasaa esityksiä);
- Edistää translaatioinvarianttiutta ja laskennallista tehokkuutta.
- Litistetään ominaisuuskartat 1D-vektoriksi luokittelua varten;
- Yhdistetään lopulliseen ulostulokerrokseen käyttäen Softmaxia (moniluokkaluokittelu) tai Sigmoidia (binääriluokittelu).
CNN:t ovat tehokkaita, koska ne pystyvät automaattisesti oppimaan piirteitä kuvista ilman, että ihmisen tarvitsee ohjelmoida jokaista yksityiskohtaa erikseen. Tämän vuoksi niitä käytetään itseajavissa autoissa, kasvojentunnistuksessa, lääketieteellisessä kuvantamisessa ja monissa muissa tosielämän sovelluksissa.
1. Mikä on CNN-verkkojen tärkein etu perinteisiin neuroverkkoihin verrattuna kuvien käsittelyssä?
2. Yhdistä CNN:n osa sen tehtävään.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme