Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Ankkurilaatikot | Osio
Soveltava tietokonenäkö

bookAnkkurilaatikot

Pyyhkäise näyttääksesi valikon

Note
Määritelmä

Anchor box on ennalta määritelty rajauslaatikko, jolla on kiinteä koko ja kuvasuhde, sijoitettuna tiettyihin kohtiin kuvan alueella.

Miksi ankkurilaatikoita käytetään objektintunnistuksessa

Ankkurilaatikot ovat keskeinen käsite nykyaikaisissa objektintunnistusmalleissa, kuten Faster R-CNN ja YOLO. Ne toimivat ennalta määriteltyinä viitelaatikoina, jotka auttavat tunnistamaan erikokoisia ja -muotoisia objekteja, tehden tunnistuksesta nopeampaa ja luotettavampaa.

Sen sijaan, että objektit tunnistettaisiin täysin alusta, mallit käyttävät ankkurilaatikoita lähtökohtina ja säätävät niitä paremmin havaittuihin objekteihin sopiviksi. Tämä lähestymistapa parantaa tehokkuutta ja tarkkuutta, erityisesti erikokoisten objektien tunnistuksessa.

Ero ankkurilaatikon ja rajauslaatikon välillä

  • Ankkurilaatikko: ennalta määritelty malli, joka toimii viitteenä objektintunnistuksessa;
  • Rajauslaatikko: lopullinen ennustettu laatikko, joka on säädetty ankkurilaatikon pohjalta vastaamaan todellista objektia.
anchor_bounding_difference

Toisin kuin rajaavat laatikot, joita säädetään dynaamisesti ennustuksen aikana, ankkurilaatikot ovat kiinteitä tietyissä kohdissa ennen objektin tunnistusta. Mallit oppivat hienosäätämään ankkurilaatikoita muuttamalla niiden kokoa, sijaintia ja kuvasuhdetta, jolloin niistä muodostuu lopulliset rajaavat laatikot, jotka kuvaavat tunnistetut objektit tarkasti.

Kuinka verkko tuottaa ankkurilaatikoita

Ankkurilaatikoita ei sovelleta suoraan kuvaan, vaan ne asetetaan kuvan ominaisuuskarttoihin, jotka on poimittu kuvasta. Ominaisuuksien poiminnan jälkeen joukko ankkurilaatikoita sijoitetaan näille ominaisuuskartoille vaihdellen koon ja kuvasuhteen mukaan. Ankkurilaatikoiden muotojen valinta on keskeistä ja vaatii tasapainottelua pienten ja suurten objektien tunnistamisen välillä.

Ankkurilaatikoiden kokojen määrittelyssä käytetään yleensä manuaalista valintaa ja klusterointialgoritmeja, kuten K-Means, analysoimaan aineistoa ja tunnistamaan yleisimmät objektien muodot ja koot. Nämä ennalta määritetyt ankkurilaatikot asetetaan eri kohtiin ominaisuuskartoilla. Esimerkiksi objektintunnistusmalli voi käyttää ankkurilaatikoita, joiden koot ovat (16x16), (32x32), (64x64), ja kuvasuhteet 1:1, 1:2, and 2:1.

anchor_box_gen

Kun nämä ankkurilaatikot on määritelty, niitä käytetään piirrekarteissa, ei alkuperäisessä kuvassa. Malli liittää useita ankkurilaatikoita jokaiseen piirrekatteen sijaintiin kattaen erilaisia muotoja ja kokoja. Koulutuksen aikana verkko säätää ankkurilaatikoita ennustamalla siirtymiä, tarkentaen niiden kokoa ja sijaintia, jotta ne sopivat paremmin kohteisiin.

Ankkurilaatikosta rajaavaan laatikkoon

Kun ankkurilaatikot on liitetty kohteisiin, malli ennustaa siirtymiä niiden tarkentamiseksi. Nämä siirtymät sisältävät:

  • Laatikon keskipisteen koordinaattien säätäminen;
  • Leveyden ja korkeuden skaalaaminen;
  • Laatikon siirtäminen paremmin kohteen mukaiseksi.

Näiden muunnosten avulla malli muuntaa ankkurilaatikot lopullisiksi rajaaviksi laatikoiksi, jotka vastaavat tarkasti kuvan kohteita.

anchor_to_bounding

Lähestymistavat ilman ankkureita tai niiden määrän vähentäminen

Vaikka ankkurilaatikoita käytetään laajasti, jotkin mallit pyrkivät vähentämään niiden käyttöä tai poistamaan ne kokonaan:

  • Ankkurittomat menetelmät: mallit kuten CenterNet ja FCOS ennustavat kohteiden sijainnit suoraan ilman ennalta määriteltyjä ankkureita, mikä vähentää monimutkaisuutta;
  • Vähennetyt ankkurilähestymistavat: EfficientDet ja YOLOv4 optimoivat käytettyjen ankkurilaatikoiden määrän, tasapainottaen tunnistuksen nopeuden ja tarkkuuden.

Näiden lähestymistapojen tavoitteena on parantaa kohteentunnistuksen tehokkuutta säilyttäen korkea suorituskyky, erityisesti reaaliaikaisissa sovelluksissa.

Yhteenvetona, ankkurilaatikot ovat olennainen osa kohteentunnistusta, auttaen malleja tunnistamaan kohteet tehokkaasti eri kokojen ja kuvasuhteiden välillä. Uudet kehitysaskeleet kuitenkin tutkivat tapoja vähentää tai poistaa ankkurilaatikot entistä nopeamman ja joustavamman tunnistuksen saavuttamiseksi.

1. Mikä on ankkurilaatikoiden ensisijainen rooli objektintunnistuksessa?

2. Miten ankkurilaatikot eroavat rajaavista laatikoista?

3. Mitä menetelmää käytetään yleisesti optimaalisten ankkurilaatikkokokojen määrittämiseen?

question mark

Mikä on ankkurilaatikoiden ensisijainen rooli objektintunnistuksessa?

Select the correct answer

question mark

Miten ankkurilaatikot eroavat rajaavista laatikoista?

Select the correct answer

question mark

Mitä menetelmää käytetään yleisesti optimaalisten ankkurilaatikkokokojen määrittämiseen?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 24

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 24
some-alt