Kurssisisältö
Konenäön Perusteet
Konenäön Perusteet
Ei-maksimin Suppressio (NMS)
Objektintunnistusmallit ennustavat usein useita päällekkäisiä rajauslaatikoita samalle objektille. Tämä johtuu siitä, että mallit tarkastelevat kuvaa eri mittakaavoissa ja kohdissa, mikä johtaa ylimääräisiin ennusteisiin. Non-Max Suppression (NMS) on olennainen jälkikäsittelyvaihe, joka tarkentaa näitä tunnistuksia valitsemalla olennaisimmat rajauslaatikot ja poistamalla tarpeettomat.
Miksi useita päällekkäisiä laatikoita syntyy
Objektintunnistimet ennustavat useita rajauslaatikoita yhdelle objektille seuraavista syistä:
Ankkurilaatikot: jotkin mallit, kuten Faster R-CNN ja YOLO, käyttävät ennalta määriteltyjä erikokoisia ankkurilaatikoita, mikä johtaa useisiin tunnistuksiin samasta objektista;
Liukuva ikkuna -menetelmät: jotkin tunnistusmenetelmät skannaavat kuvaa pienissä osissa, mikä aiheuttaa toistuvia tunnistuksia päällekkäisillä alueilla;
Korkeat luottamuspisteet: malli antaa jokaiselle ennusteelle luottamuspisteet, ja samankaltaiset ennusteet, joilla on korkea luottamus, voivat olla merkittävästi päällekkäisiä.
Jos näitä ylimääräisiä laatikoita ei suodateta, ne voivat heikentää objektintunnistuksen suorituskykyä lisäämällä laskennallista monimutkaisuutta ja tekemällä objektien lukumäärästä epäluotettavan.
Non-Max Suppressionin toimintaperiaate
NMS:tä käytetään poistamaan päällekkäiset tunnistukset ja säilyttämään luotettavin rajauslaatikko. Menettely etenee seuraavasti:
Pisteiden järjestäminen: järjestä kaikki ennustetut rajauslaatikot laskevaan järjestykseen niiden luottamuspisteiden perusteella;
Parhaan laatikon valinta: valitse korkein pistemäärä saanut laatikko ja lisää se lopulliseen tunnistuslistaan;
IoU-laskenta: laske Intersection Over Union (IoU) valitun laatikon ja kaikkien jäljellä olevien laatikoiden välillä;
Kynnysarvon käyttö: poista laatikot, joiden IoU ylittää asetetun kynnysarvon (esim. 0,5), koska ne todennäköisesti edustavat samaa objektia;
Toisto: jatka tätä prosessia seuraavaksi korkeimman pistemäärän laatikolle, kunnes kaikki laatikot on käsitelty.
Soft-NMS: Älykkäämpi vaihtoehto
Tavallinen NMS poistaa kaikki päällekkäiset laatikot, joiden IoU-arvo ylittää tietyn kynnyksen, mikä voi joskus johtaa hyödyllisten havaintojen poistamiseen. Soft-NMS parantaa tätä prosessia pienentämällä päällekkäisten laatikoiden luottamuspisteitä poistamisen sijaan. Tämä mahdollistaa joustavamman tukahdutusprosessin ja voi parantaa havaintotarkkuutta tiheissä kohdeympäristöissä.
Keskeiset erot tavallisen NMS:n ja Soft-NMS:n välillä:
Tavallinen NMS: poistaa päällekkäiset laatikot, joiden IoU-arvo ylittää kynnyksen;
Soft-NMS: pienentää päällekkäisten laatikoiden luottamuspisteitä poistamisen sijaan, mikä tekee siitä joustavamman osittain peittyneiden kohteiden tunnistamiseen.
Tarkkuuden ja nopeuden tasapainottaminen NMS:ssä
Oikean IoU-kynnyksen valinta on ratkaisevaa:
Korkeammat kynnykset (esim. 0.6 - 0.7): aggressiivisempi suodatus, jolloin säilytetään vain luotettavimmat laatikot, mutta osa oikeista havainnoista voi jäädä pois;
Matalammat kynnykset (esim. 0.3 - 0.4): säilyttää enemmän päällekkäisiä laatikoita, mikä voi olla hyödyllistä ruuhkaisissa kohtauksissa, mutta voi lisätä vääriä positiivisia havaintoja.
Optimoitujen toteutusten, kuten TensorFlow'n tai OpenCV:n sisäänrakennettujen NMS-funktioiden, käyttö voi nopeuttaa käsittelyä reaaliaikaisissa sovelluksissa.
Non-Max Suppression on olennainen tekniikka kohteentunnistuksessa ylimääräisten rajauslaatikoiden poistamiseksi ja mallin tarkkuuden parantamiseksi. Tavallinen NMS poistaa tehokkaasti päällekkäiset havainnot, kun taas Soft-NMS hienosäätää prosessia säätämällä luottamuspisteitä poistamisen sijaan. Säätelemällä IoU-kynnyksiä voidaan löytää sopiva tasapaino tunnistustarkkuuden ja laskennallisen tehokkuuden välillä.
1. Mikä on Non-Max Suppressionin (NMS) päätarkoitus objektin tunnistuksessa?
2. Miten perinteinen NMS määrittää, mitkä rajaavat laatikot poistetaan?
3. Mikä on keskeinen ero perinteisen NMS:n ja Soft-NMS:n välillä?
Kiitos palautteestasi!