Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Ankarlådor | Sektion
/
Tillämpad Datorseende

bookAnkarlådor

Svep för att visa menyn

Note
Definition

Anchor box är en fördefinierad avgränsningsruta med fast storlek och bildförhållande, placerad på specifika positioner över en bild.

Varför ankarboxar används vid objektdetektering

Ankarboxar är ett grundläggande begrepp i moderna objektdetekteringsmodeller såsom Faster R-CNN och YOLO. De fungerar som fördefinierade referensrutor som hjälper till att upptäcka objekt av olika storlekar och bildförhållanden, vilket gör detekteringen snabbare och mer tillförlitlig.

Istället för att upptäcka objekt från grunden använder modeller ankarboxar som utgångspunkt och justerar dem för att bättre passa de upptäckta objekten. Detta tillvägagångssätt förbättrar effektivitet och noggrannhet, särskilt vid detektering av objekt i varierande skala.

Skillnad mellan ankarbox och avgränsningsruta

  • Ankarbox: en fördefinierad mall som fungerar som referens vid objektdetektering;
  • Avgränsningsruta: den slutliga förutsagda rutan efter att justeringar har gjorts på en ankarbox för att matcha det faktiska objektet.
anchor_bounding_difference

Till skillnad från avgränsningsrutor, som justeras dynamiskt under prediktionen, är ankarboxar fixerade på specifika positioner innan någon objektdetektering sker. Modeller lär sig att förfina ankarboxar genom att justera deras storlek, position och bildförhållande, vilket slutligen omvandlar dem till slutliga avgränsningsrutor som exakt representerar detekterade objekt.

Hur ett nätverk genererar ankarboxar

Ankarboxar appliceras inte direkt på en bild utan på funktionskartor som extraherats från bilden. Efter funktionsutvinning placeras en uppsättning ankarboxar på dessa funktionskartor, varierande i storlek och bildförhållande. Valet av ankarboxarnas former är avgörande och innebär en avvägning mellan att detektera små och stora objekt.

För att definiera ankarboxarnas storlekar används vanligtvis en kombination av manuell selektion och klustringsalgoritmer som K-Means för att analysera datamängden och fastställa de vanligaste objektformerna och storlekarna. Dessa fördefinierade ankarboxar appliceras sedan på olika positioner över funktionskartorna. Till exempel kan en objektdetekteringsmodell använda ankarboxar av storlekar (16x16), (32x32), (64x64), med bildförhållanden såsom 1:1, 1:2, and 2:1.

anchor_box_gen

När dessa ankarlådor har definierats appliceras de på funktionskartor, inte på den ursprungliga bilden. Modellen tilldelar flera ankarlådor till varje plats på funktionskartan, vilket täcker olika former och storlekar. Under träning justerar nätverket ankarlådorna genom att förutsäga förskjutningar, vilket förfinar deras storlek och position för att bättre passa objekten.

Från ankarlåda till avgränsningsruta

När ankarlådor har tilldelats objekt förutspår modellen förskjutningar för att förfina dem. Dessa förskjutningar inkluderar:

  • Justering av lådans mittkoordinater;
  • Skalning av bredd och höjd;
  • Förflyttning av lådan för att bättre anpassa den till objektet.

Genom att tillämpa dessa transformationer omvandlar modellen ankarlådor till slutgiltiga avgränsningsrutor som noggrant matchar objekten i en bild.

anchor_to_bounding

Metoder som inte använder ankare eller minskar deras antal

Även om ankarboxar är allmänt använda, strävar vissa modeller efter att minska beroendet av dem eller eliminera dem helt:

  • Ankarfria metoder: modeller som CenterNet och FCOS förutspår objektens positioner direkt utan fördefinierade ankare, vilket minskar komplexiteten;
  • Metoder med reducerat antal ankare: EfficientDet och YOLOv4 optimerar antalet använda ankarboxar för att balansera detekteringshastighet och noggrannhet.

Dessa metoder syftar till att förbättra effektiviteten i objektdetektering samtidigt som hög prestanda bibehålls, särskilt för realtidsapplikationer.

Sammanfattningsvis är ankarboxar en avgörande del av objektdetektering och hjälper modeller att effektivt upptäcka objekt i olika storlekar och bildförhållanden. Nya framsteg undersöker dock sätt att minska eller eliminera ankarboxar för ännu snabbare och mer flexibel detektering.

1. Vad är den primära rollen för anchor boxes vid objektigenkänning?

2. Hur skiljer sig anchor boxes från bounding boxes?

3. Vilken metod används vanligtvis för att bestämma optimala storlekar på anchor boxes?

question mark

Vad är den primära rollen för anchor boxes vid objektigenkänning?

Select the correct answer

question mark

Hur skiljer sig anchor boxes från bounding boxes?

Select the correct answer

question mark

Vilken metod används vanligtvis för att bestämma optimala storlekar på anchor boxes?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 24

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 1. Kapitel 24
some-alt