Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele YOLO-mallin Yleiskatsaus | Esineentunnistus
Konenäön Perusteet
course content

Kurssisisältö

Konenäön Perusteet

Konenäön Perusteet

1. Johdatus Tietokonenäköön
2. Kuvankäsittely OpenCV:llä
3. Konvoluutioneuroverkot
4. Esineentunnistus
5. Edistyneiden Aiheiden Yleiskatsaus

book
YOLO-mallin Yleiskatsaus

YOLO (You Only Look Once) -algoritmi on nopea ja tehokas objektintunnistusmalli. Toisin kuin perinteiset lähestymistavat, kuten R-CNN, jotka käyttävät useita vaiheita, YOLO käsittelee koko kuvan yhdellä kertaa, mikä tekee siitä ihanteellisen reaaliaikaisiin sovelluksiin.

Miten YOLO eroaa R-CNN-lähestymistavoista

Perinteiset objektintunnistusmenetelmät, kuten R-CNN ja sen variantit, perustuvat kaksivaiheiseen prosessiin: ensin luodaan alue-ehdotuksia ja sitten luokitellaan jokainen ehdotettu alue. Vaikka tämä lähestymistapa on tehokas, se on laskennallisesti raskas ja hidastaa päättelyä, mikä tekee siitä vähemmän sopivan reaaliaikaisiin sovelluksiin.

YOLO (You Only Look Once) käyttää täysin erilaista lähestymistapaa. Se jakaa syötekuvan ruudukkoon ja ennustaa rajauslaatikot sekä luokkien todennäköisyydet jokaiselle solulle yhdellä eteenpäin suuntautuvalla laskennalla. Tämä malli muotoilee objektintunnistuksen yhtenä regressio-ongelmana, mikä mahdollistaa YOLO:n reaaliaikaisen suorituskyvyn.

Toisin kuin R-CNN-pohjaiset menetelmät, jotka keskittyvät vain paikallisiin alueisiin, YOLO käsittelee koko kuvan kerralla, jolloin se pystyy hyödyntämään globaalia kontekstuaalista tietoa. Tämä parantaa suorituskykyä useiden tai päällekkäisten objektien tunnistuksessa, säilyttäen samalla korkean nopeuden ja tarkkuuden.

YOLO-arkkitehtuuri ja ruudukkoon perustuvat ennusteet

YOLO jakaa syötekuvan S × S -ruudukkoon, jossa jokainen ruudun solu vastaa niiden objektien tunnistamisesta, joiden keskipiste osuu kyseiseen soluun. Jokainen solu ennustaa rajaavan laatikon koordinaatit (x, y, leveys, korkeus), objektin luottamuspisteen ja luokkien todennäköisyydet. Koska YOLO käsittelee koko kuvan yhdellä eteenpäin suuntautuvalla laskennalla, se on erittäin tehokas verrattuna aiempiin objektintunnistusmalleihin.

Häviöfunktio ja luokkien luottamuspisteet

YOLO optimoi tunnistustarkkuutta mukautetulla häviöfunktiolla, joka sisältää:

  • Lokalisointihäviö: mittaa rajaavan laatikon tarkkuutta;

  • Luottamushäviö: varmistaa, että ennusteet osoittavat oikein objektin läsnäolon;

  • Luokitteluhäviö: arvioi, kuinka hyvin ennustettu luokka vastaa todellista luokkaa.

Tulosten parantamiseksi YOLO käyttää ankkurilaatikoita ja non-max suppressionia (NMS) poistaakseen päällekkäiset tunnistukset.

YOLO:n edut: Nopeuden ja tarkkuuden tasapaino

YOLO:n merkittävin etu on nopeus. Koska tunnistus tapahtuu yhdellä läpikäynnillä, YOLO on huomattavasti nopeampi kuin R-CNN-pohjaiset menetelmät, mikä tekee siitä sopivan reaaliaikaisiin sovelluksiin, kuten autonomiseen ajamiseen ja valvontaan. Varhaiset YOLO-versiot olivat kuitenkin heikompia pienten objektien tunnistuksessa, mutta myöhemmät versiot ovat parantaneet tätä.

YOLO: Lyhyt historia

YOLO, jonka kehittivät Joseph Redmon ja Ali Farhadi vuonna 2015, mullisti objektintunnistuksen yhden läpikäynnin prosessoinnilla.

  • YOLOv2 (2016): lisäsi batch-normalisoinnin, ankkurilaatikot ja dimensio-klusterit;

  • YOLOv3 (2018): toi tehokkaamman rungon, useita ankkureita ja spatiaalisen pyramidipoolauksen;

  • YOLOv4 (2020): lisäsi Mosaic-data-aineiston laajennuksen, ankkurittoman tunnistuspään ja uuden häviöfunktion;

  • YOLOv5: paransi suorituskykyä hyperparametrien optimoinnilla, kokeilujen seurannalla ja automaattisilla vientiominaisuuksilla;

  • YOLOv6 (2022): Meituanin avoimesti julkaisema ja käytössä autonomisissa toimitusroboteissa;

  • YOLOv7: laajensi ominaisuuksia kattamaan asentojen tunnistuksen;

  • YOLOv8 (2023): paransi nopeutta, joustavuutta ja tehokkuutta konenäön tekoälytehtäviin;

  • YOLOv9: esitteli Programmable Gradient Informationin (PGI) ja Generalized Efficient Layer Aggregation Networkin (GELAN);

  • YOLOv10: Tsinghuan yliopiston kehittämä, poisti Non-Maximum Suppressionin (NMS) End-to-End-tunnistuspäällä;

  • YOLOv11: uusin malli, joka tarjoaa huipputason suorituskykyä objektintunnistuksessa, segmentoinnissa ja luokittelussa.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 7

Kysy tekoälyä

expand
ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

course content

Kurssisisältö

Konenäön Perusteet

Konenäön Perusteet

1. Johdatus Tietokonenäköön
2. Kuvankäsittely OpenCV:llä
3. Konvoluutioneuroverkot
4. Esineentunnistus
5. Edistyneiden Aiheiden Yleiskatsaus

book
YOLO-mallin Yleiskatsaus

YOLO (You Only Look Once) -algoritmi on nopea ja tehokas objektintunnistusmalli. Toisin kuin perinteiset lähestymistavat, kuten R-CNN, jotka käyttävät useita vaiheita, YOLO käsittelee koko kuvan yhdellä kertaa, mikä tekee siitä ihanteellisen reaaliaikaisiin sovelluksiin.

Miten YOLO eroaa R-CNN-lähestymistavoista

Perinteiset objektintunnistusmenetelmät, kuten R-CNN ja sen variantit, perustuvat kaksivaiheiseen prosessiin: ensin luodaan alue-ehdotuksia ja sitten luokitellaan jokainen ehdotettu alue. Vaikka tämä lähestymistapa on tehokas, se on laskennallisesti raskas ja hidastaa päättelyä, mikä tekee siitä vähemmän sopivan reaaliaikaisiin sovelluksiin.

YOLO (You Only Look Once) käyttää täysin erilaista lähestymistapaa. Se jakaa syötekuvan ruudukkoon ja ennustaa rajauslaatikot sekä luokkien todennäköisyydet jokaiselle solulle yhdellä eteenpäin suuntautuvalla laskennalla. Tämä malli muotoilee objektintunnistuksen yhtenä regressio-ongelmana, mikä mahdollistaa YOLO:n reaaliaikaisen suorituskyvyn.

Toisin kuin R-CNN-pohjaiset menetelmät, jotka keskittyvät vain paikallisiin alueisiin, YOLO käsittelee koko kuvan kerralla, jolloin se pystyy hyödyntämään globaalia kontekstuaalista tietoa. Tämä parantaa suorituskykyä useiden tai päällekkäisten objektien tunnistuksessa, säilyttäen samalla korkean nopeuden ja tarkkuuden.

YOLO-arkkitehtuuri ja ruudukkoon perustuvat ennusteet

YOLO jakaa syötekuvan S × S -ruudukkoon, jossa jokainen ruudun solu vastaa niiden objektien tunnistamisesta, joiden keskipiste osuu kyseiseen soluun. Jokainen solu ennustaa rajaavan laatikon koordinaatit (x, y, leveys, korkeus), objektin luottamuspisteen ja luokkien todennäköisyydet. Koska YOLO käsittelee koko kuvan yhdellä eteenpäin suuntautuvalla laskennalla, se on erittäin tehokas verrattuna aiempiin objektintunnistusmalleihin.

Häviöfunktio ja luokkien luottamuspisteet

YOLO optimoi tunnistustarkkuutta mukautetulla häviöfunktiolla, joka sisältää:

  • Lokalisointihäviö: mittaa rajaavan laatikon tarkkuutta;

  • Luottamushäviö: varmistaa, että ennusteet osoittavat oikein objektin läsnäolon;

  • Luokitteluhäviö: arvioi, kuinka hyvin ennustettu luokka vastaa todellista luokkaa.

Tulosten parantamiseksi YOLO käyttää ankkurilaatikoita ja non-max suppressionia (NMS) poistaakseen päällekkäiset tunnistukset.

YOLO:n edut: Nopeuden ja tarkkuuden tasapaino

YOLO:n merkittävin etu on nopeus. Koska tunnistus tapahtuu yhdellä läpikäynnillä, YOLO on huomattavasti nopeampi kuin R-CNN-pohjaiset menetelmät, mikä tekee siitä sopivan reaaliaikaisiin sovelluksiin, kuten autonomiseen ajamiseen ja valvontaan. Varhaiset YOLO-versiot olivat kuitenkin heikompia pienten objektien tunnistuksessa, mutta myöhemmät versiot ovat parantaneet tätä.

YOLO: Lyhyt historia

YOLO, jonka kehittivät Joseph Redmon ja Ali Farhadi vuonna 2015, mullisti objektintunnistuksen yhden läpikäynnin prosessoinnilla.

  • YOLOv2 (2016): lisäsi batch-normalisoinnin, ankkurilaatikot ja dimensio-klusterit;

  • YOLOv3 (2018): toi tehokkaamman rungon, useita ankkureita ja spatiaalisen pyramidipoolauksen;

  • YOLOv4 (2020): lisäsi Mosaic-data-aineiston laajennuksen, ankkurittoman tunnistuspään ja uuden häviöfunktion;

  • YOLOv5: paransi suorituskykyä hyperparametrien optimoinnilla, kokeilujen seurannalla ja automaattisilla vientiominaisuuksilla;

  • YOLOv6 (2022): Meituanin avoimesti julkaisema ja käytössä autonomisissa toimitusroboteissa;

  • YOLOv7: laajensi ominaisuuksia kattamaan asentojen tunnistuksen;

  • YOLOv8 (2023): paransi nopeutta, joustavuutta ja tehokkuutta konenäön tekoälytehtäviin;

  • YOLOv9: esitteli Programmable Gradient Informationin (PGI) ja Generalized Efficient Layer Aggregation Networkin (GELAN);

  • YOLOv10: Tsinghuan yliopiston kehittämä, poisti Non-Maximum Suppressionin (NMS) End-to-End-tunnistuspäällä;

  • YOLOv11: uusin malli, joka tarjoaa huipputason suorituskykyä objektintunnistuksessa, segmentoinnissa ja luokittelussa.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 7
Pahoittelemme, että jotain meni pieleen. Mitä tapahtui?
some-alt