Kurssisisältö
Konenäön Perusteet
Konenäön Perusteet
Ankkurilaatikot
Miksi ankkurilaatikoita käytetään objektintunnistuksessa
Ankkurilaatikot ovat keskeinen käsite nykyaikaisissa objektintunnistusmalleissa, kuten Faster R-CNN ja YOLO. Ne toimivat ennalta määriteltyinä viitelaatikoina, jotka auttavat havaitsemaan eri kokoisia ja eri kuvasuhteisia objekteja, tehden tunnistuksesta nopeampaa ja luotettavampaa.
Sen sijaan, että objektit tunnistettaisiin täysin alusta, mallit käyttävät ankkurilaatikoita lähtökohtina ja säätävät niitä paremmin havaittuihin objekteihin sopiviksi. Tämä lähestymistapa parantaa tehokkuutta ja tarkkuutta, erityisesti erikokoisten objektien tunnistuksessa.
Ero ankkurilaatikon ja rajaavan laatikon välillä
Ankkurilaatikko: ennalta määritelty malli, joka toimii viitteenä objektintunnistuksen aikana;
Rajaava laatikko: lopullinen ennustettu laatikko, joka saadaan säätämällä ankkurilaatikkoa vastaamaan todellista objektia.
Toisin kuin rajaavat laatikot, joita säädetään dynaamisesti ennustuksen aikana, ankkurilaatikot ovat kiinteitä tietyissä kohdissa ennen objektintunnistuksen alkamista. Mallit oppivat tarkentamaan ankkurilaatikoita säätämällä niiden kokoa, sijaintia ja kuvasuhdetta, jolloin niistä muodostuu lopulliset rajaavat laatikot, jotka kuvaavat havaitut objektit tarkasti.
Kuinka verkko luo ankkurilaatikot
Ankkurilaatikoita ei sovelleta suoraan kuvaan, vaan kuvan pohjalta erotettuihin piirrekarteisiin. Piirre-ekstraktion jälkeen joukko ankkurilaatikoita asetetaan näille piirrekarteille, vaihdellen kooltaan ja kuvasuhteeltaan. Ankkurilaatikoiden muotojen valinta on keskeistä ja vaatii tasapainottelua pienten ja suurten objektien tunnistamisen välillä.
Ankkurilaatikoiden kokojen määrittelyssä käytetään tyypillisesti manuaalista valintaa ja klusterointialgoritmeja, kuten K-Means, analysoimaan aineistoa ja tunnistamaan yleisimmät objektien muodot ja koot. Nämä ennalta määritellyt ankkurilaatikot asetetaan eri kohtiin piirrekarteilla. Esimerkiksi objektintunnistusmalli voi käyttää ankkurilaatikoita, joiden koot ovat (16x16), (32x32), (64x64)
, ja kuvasuhteet 1:1, 1:2, and 2:1
.
Kun nämä ankkurilaatikot on määritelty, ne sovelletaan piirrekarteille, ei alkuperäiseen kuvaan. Malli liittää useita ankkurilaatikoita jokaiseen piirrekatteen sijaintiin, kattaen erilaisia muotoja ja kokoja. Koulutuksen aikana verkko säätää ankkurilaatikoita ennustamalla siirtymiä, tarkentaen niiden kokoa ja sijaintia, jotta ne sopivat paremmin objekteihin.
Ankkurilaatikosta rajaavaan laatikkoon
Kun ankkurilaatikot on liitetty objekteihin, malli ennustaa siirtymiä niiden tarkentamiseksi. Näihin siirtymiin kuuluu:
Laatikon keskipisteen koordinaattien säätäminen;
Leveyden ja korkeuden skaalaaminen;
Laatikon siirtäminen paremmin kohdistumaan objektiin.
Näiden muunnosten avulla malli muuntaa ankkurilaatikot lopullisiksi rajaaviksi laatikoiksi, jotka vastaavat tarkasti kuvan objekteja.
Lähestymistavat ilman ankkurilaatikoita tai niiden määrän vähentäminen
Vaikka ankkurilaatikoita käytetään laajasti, jotkin mallit pyrkivät vähentämään niiden käyttöä tai poistamaan ne kokonaan:
Ankkurittomat menetelmät: mallit kuten
CenterNet
jaFCOS
ennustavat kohteiden sijainnit suoraan ilman ennalta määriteltyjä ankkureita, mikä vähentää monimutkaisuutta;Vähennetyt ankkurilähestymistavat:
EfficientDet
jaYOLOv4
optimoivat käytettyjen ankkurilaatikoiden määrää, tasapainottaen tunnistuksen nopeuden ja tarkkuuden.
Näiden lähestymistapojen tavoitteena on parantaa kohteentunnistuksen tehokkuutta säilyttäen korkea suorituskyky, erityisesti reaaliaikaisissa sovelluksissa.
Yhteenvetona ankkurilaatikot ovat olennainen osa kohteentunnistusta, auttaen malleja tunnistamaan kohteita tehokkaasti eri kokoisina ja eri kuvasuhteilla. Uudet kehitysaskeleet kuitenkin tutkivat tapoja vähentää tai poistaa ankkurilaatikot entistä nopeamman ja joustavamman tunnistuksen saavuttamiseksi.
1. Mikä on ankkurilaatikoiden ensisijainen rooli kohteentunnistuksessa?
2. Miten ankkurilaatikot eroavat rajaavista laatikoista?
3. Mitä menetelmää käytetään yleisesti optimaalisien ankkurilaatikkokokojen määrittämiseen?
Kiitos palautteestasi!