Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele YOLO-mallin Yleiskatsaus | Osio
Practice
Projects
Quizzes & Challenges
Visat
Challenges
/
Soveltava tietokonenäkö

bookYOLO-mallin Yleiskatsaus

Pyyhkäise näyttääksesi valikon

YOLO (You Only Look Once) -algoritmi on nopea ja tehokas objektintunnistusmalli. Toisin kuin perinteiset lähestymistavat, kuten R-CNN, jotka käyttävät useita vaiheita, YOLO käsittelee koko kuvan yhdellä kertaa, mikä tekee siitä ihanteellisen reaaliaikaisiin sovelluksiin.

Miten YOLO eroaa R-CNN-lähestymistavoista

Perinteiset objektintunnistusmenetelmät, kuten R-CNN ja sen variantit, perustuvat kaksivaiheiseen prosessiin: ensin luodaan alue-ehdotuksia, minkä jälkeen jokainen ehdotettu alue luokitellaan. Vaikka tämä lähestymistapa on tehokas, se on laskennallisesti raskas ja hidastaa päättelyä, mikä tekee siitä vähemmän sopivan reaaliaikaisiin sovelluksiin.

YOLO (You Only Look Once) käyttää täysin erilaista lähestymistapaa. Se jakaa syötekuvan ruudukkoon ja ennustaa rajauslaatikot sekä luokkien todennäköisyydet jokaiselle solulle yhdellä eteenpäin suuntautuvalla laskennalla. Tämä rakenne muotoilee objektintunnistuksen yhdeksi regressio-ongelmaksi, mikä mahdollistaa YOLO:n reaaliaikaisen suorituskyvyn.

Toisin kuin R-CNN-pohjaiset menetelmät, jotka keskittyvät vain paikallisiin alueisiin, YOLO käsittelee koko kuvan kerralla, mikä mahdollistaa globaalin kontekstin hyödyntämisen. Tämä parantaa suorituskykyä useiden tai päällekkäisten objektien tunnistuksessa, säilyttäen samalla korkean nopeuden ja tarkkuuden.

YOLO-arkkitehtuuri ja ruudukkoon perustuvat ennusteet

YOLO jakaa syötekuvan S × S -ruudukkoon, jossa jokainen ruutukenno vastaa niiden objektien tunnistamisesta, joiden keskipiste sijaitsee kyseisessä solussa. Jokainen solu ennustaa rajaavan laatikon koordinaatit (x, y, leveys, korkeus), objektin luottamuspisteen ja luokkien todennäköisyydet. Koska YOLO käsittelee koko kuvan yhdellä eteenpäin suuntautuvalla laskennalla, se on erittäin tehokas verrattuna aiempiin objektintunnistusmalleihin.

yolo_architecture

Häviöfunktio ja luokkien luottamuspisteet

YOLO optimoi tunnistustarkkuutta mukautetulla häviöfunktiolla, joka sisältää:

  • Lokalisointihäviö: mittaa rajaavan laatikon tarkkuutta;
  • Luottamushäviö: varmistaa, että ennusteet osoittavat objektin läsnäolon oikein;
  • Luokitteluhäviö: arvioi, kuinka hyvin ennustettu luokka vastaa todellista luokkaa.

Tulosten parantamiseksi YOLO käyttää ankkurilaatikoita ja non-max suppression (NMS) -menetelmää päällekkäisten tunnistusten poistamiseen.

YOLO:n edut: Nopeuden ja tarkkuuden tasapaino

YOLO:n tärkein etu on nopeus. Koska tunnistus tapahtuu yhdellä läpikäynnillä, YOLO on huomattavasti nopeampi kuin R-CNN-pohjaiset menetelmät, mikä tekee siitä sopivan reaaliaikaisiin sovelluksiin, kuten autonomiseen ajamiseen ja valvontaan. Varhaiset YOLO-versiot olivat heikompia pienten objektien tunnistuksessa, mutta myöhemmät versiot ovat parantaneet tätä.

YOLO: Lyhyt historia

YOLO, jonka kehittivät Joseph Redmon ja Ali Farhadi vuonna 2015, mullisti objektien tunnistuksen yhden läpikäynnin prosessoinnillaan.

  • YOLOv2 (2016): lisäsi batch-normalisoinnin, ankkurilaatikot ja dimensio-klusterit;
  • YOLOv3 (2018): esitteli tehokkaamman selkärangan, useita ankkureita ja spatiaalisen pyramidipoolauksen;
  • YOLOv4 (2020): toi Mosaic-datan augmentoinnin, ankkurittoman tunnistuspään ja uuden tappiofunktion;
  • YOLOv5: paransi suorituskykyä hyperparametrien optimoinnilla, kokeilujen seurannalla ja automaattisilla vientiominaisuuksilla;
  • YOLOv6 (2022): avoimen lähdekoodin Meituanin toimesta ja käytössä autonomisissa jakeluroboteissa;
  • YOLOv7: laajensi ominaisuuksia kattamaan asentojen tunnistuksen;
  • YOLOv8 (2023): paransi nopeutta, joustavuutta ja tehokkuutta konenäön tekoälytehtäviin;
  • YOLOv9: esitteli ohjelmoitavan gradientti-informaation (PGI) ja Generalized Efficient Layer Aggregation Networkin (GELAN);
  • YOLOv10: kehitetty Tsinghuan yliopistossa, poisti Non-Maximum Suppressionin (NMS) End-to-End-tunnistuspäällä;
  • YOLOv11: uusin malli, joka tarjoaa huipputason suorituskykyä objektien tunnistuksessa, segmentoinnissa ja luokittelussa.
yolo_history
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 25

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 25
some-alt