Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Kohteentunnistus | Esineentunnistus
Konenäön Perusteet
course content

Kurssisisältö

Konenäön Perusteet

Konenäön Perusteet

1. Johdatus Tietokonenäköön
2. Kuvankäsittely OpenCV:llä
3. Konvoluutioneuroverkot
4. Esineentunnistus
5. Edistyneiden Aiheiden Yleiskatsaus

book
Kohteentunnistus

Objektin tunnistus on merkittävä edistysaskel kuvien luokittelun ja paikantamisen jälkeen. Siinä missä luokittelu määrittää, mikä objekti kuvassa on, ja paikantaminen tunnistaa, missä yksittäinen objekti sijaitsee, objektin tunnistus laajentaa tätä tunnistamalla useita objekteja ja niiden sijainnit yhdessä kuvassa.

Mikä erottaa objektin tunnistuksen?

Toisin kuin luokittelu, joka antaa koko kuvalle yhden luokan, objektin tunnistus sisältää sekä luokittelun että paikantamisen useille objekteille. Tunnistusmallin täytyy ennustaa rajauslaatikot jokaisen objektin ympärille ja luokitella ne oikein. Tämä tekee objektin tunnistuksesta monimutkaisemman ja laskennallisesti vaativamman tehtävän kuin pelkkä luokittelu.

Liukuvan ikkunan menetelmä ja sen rajoitukset

Perinteinen menetelmä objektin tunnistukseen on liukuvan ikkunan lähestymistapa, jossa kiinteän kokoinen ikkuna liikkuu kuvan yli ja luokittelee jokaisen osan. Vaikka menetelmä on käsitteellisesti yksinkertainen, siinä on useita rajoituksia:

  • Laskennallisesti raskas: vaatii kuvan läpikäynnin useissa mittakaavoissa ja kohdissa, mikä johtaa suureen käsittelyaikaan;

  • Jäykät ikkunakoot: objektit vaihtelevat kooltaan ja mittasuhteiltaan, mikä tekee kiinteän kokoisista ikkunoista tehottomia;

  • Päällekkäiset laskennat: päällekkäiset ikkunat käsittelevät samoja kuvan alueita useaan kertaan, mikä tuhlaa resursseja.

Näiden tehottomuuksien vuoksi syväoppimiseen perustuvat objektin tunnistusmenetelmät ovat pitkälti korvanneet liukuvan ikkunan lähestymistavan.

Aluepohjaiset menetelmät: Selective Search & Region Proposal Networks (RPN)

Tehokkuuden parantamiseksi aluepohjaiset menetelmät ehdottavat kiinnostusalueita (RoI, Regions of Interest) koko kuvan läpikäymisen sijaan. Kaksi keskeistä tekniikkaa ovat:

  • Selective search: perinteinen lähestymistapa, jossa samankaltaiset pikselit ryhmitellään alue-ehdotuksiksi, mikä vähentää ennustettavien rajauslaatikoiden määrää. Vaikka se on tehokkaampi kuin liukuva ikkuna, se on silti hidas;

  • Region proposal networks (RPN): Faster R-CNN -mallissa käytettävä menetelmä, jossa neuroverkko tuottaa mahdollisia kohdealueita suoraan, mikä parantaa nopeutta ja tarkkuutta merkittävästi verrattuna selective search -menetelmään.

Varhaiset syväoppimiseen perustuvat lähestymistavat

Syväoppiminen mullisti objektien tunnistuksen tuomalla konvoluutiohermoverkot (CNN, convolutional neural networks) osaksi tunnistusputkia. Joitakin uraauurtavia malleja ovat:

  • R-CNN (Regions with CNNs): tässä menetelmässä CNN:tä sovelletaan jokaiseen selective searchin tuottamaan alue-ehdotukseen. Vaikka tarkkuus on huomattavasti parempi kuin perinteisissä menetelmissä, laskennallinen hitaus johtuu toistuvista CNN-laskelmista;

  • Fast R-CNN: parannus R-CNN:ään verrattuna, tässä mallissa koko kuva käsitellään ensin CNN:llä ja sen jälkeen RoI-poolaus poimii piirteet luokittelua varten, mikä nopeuttaa tunnistusta;

  • Faster R-CNN: esittelee region proposal networks (RPN), jotka korvaavat selective searchin, tehden objektien tunnistuksesta nopeampaa ja tarkempaa integroimalla alue-ehdotusten generoinnin suoraan neuroverkkoon.

Objektien tunnistus rakentuu luokittelun ja paikannuksen pohjalle, mahdollistaen useiden kohteiden tunnistamisen yhdessä kuvassa. Perinteiset menetelmät, kuten liukuvat ikkunat, on korvattu tehokkaammilla aluepohjaisilla tekniikoilla, kuten R-CNN ja sen seuraajat. Faster R-CNN, joka hyödyntää region proposal networks -menetelmää, edustaa merkittävää askelta kohti reaaliaikaista ja tarkkaa objektien tunnistusta. Edetessämme tutustumme kehittyneempiin menetelmiin, kuten YOLO ja SSD, jotka edelleen parantavat tunnistuksen nopeutta ja tehokkuutta.

1. Mikä on Faster R-CNN:n tärkein etu verrattuna Fast R-CNN:ään?

2. Miksi liukuva ikkuna -menetelmä on tehoton objektintunnistuksessa?

3. Mikä seuraavista on syväoppimiseen perustuva objektintunnistusmenetelmä?

question mark

Mikä on Faster R-CNN:n tärkein etu verrattuna Fast R-CNN:ään?

Select the correct answer

question mark

Miksi liukuva ikkuna -menetelmä on tehoton objektintunnistuksessa?

Select the correct answer

question mark

Mikä seuraavista on syväoppimiseen perustuva objektintunnistusmenetelmä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 2

Kysy tekoälyä

expand
ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

course content

Kurssisisältö

Konenäön Perusteet

Konenäön Perusteet

1. Johdatus Tietokonenäköön
2. Kuvankäsittely OpenCV:llä
3. Konvoluutioneuroverkot
4. Esineentunnistus
5. Edistyneiden Aiheiden Yleiskatsaus

book
Kohteentunnistus

Objektin tunnistus on merkittävä edistysaskel kuvien luokittelun ja paikantamisen jälkeen. Siinä missä luokittelu määrittää, mikä objekti kuvassa on, ja paikantaminen tunnistaa, missä yksittäinen objekti sijaitsee, objektin tunnistus laajentaa tätä tunnistamalla useita objekteja ja niiden sijainnit yhdessä kuvassa.

Mikä erottaa objektin tunnistuksen?

Toisin kuin luokittelu, joka antaa koko kuvalle yhden luokan, objektin tunnistus sisältää sekä luokittelun että paikantamisen useille objekteille. Tunnistusmallin täytyy ennustaa rajauslaatikot jokaisen objektin ympärille ja luokitella ne oikein. Tämä tekee objektin tunnistuksesta monimutkaisemman ja laskennallisesti vaativamman tehtävän kuin pelkkä luokittelu.

Liukuvan ikkunan menetelmä ja sen rajoitukset

Perinteinen menetelmä objektin tunnistukseen on liukuvan ikkunan lähestymistapa, jossa kiinteän kokoinen ikkuna liikkuu kuvan yli ja luokittelee jokaisen osan. Vaikka menetelmä on käsitteellisesti yksinkertainen, siinä on useita rajoituksia:

  • Laskennallisesti raskas: vaatii kuvan läpikäynnin useissa mittakaavoissa ja kohdissa, mikä johtaa suureen käsittelyaikaan;

  • Jäykät ikkunakoot: objektit vaihtelevat kooltaan ja mittasuhteiltaan, mikä tekee kiinteän kokoisista ikkunoista tehottomia;

  • Päällekkäiset laskennat: päällekkäiset ikkunat käsittelevät samoja kuvan alueita useaan kertaan, mikä tuhlaa resursseja.

Näiden tehottomuuksien vuoksi syväoppimiseen perustuvat objektin tunnistusmenetelmät ovat pitkälti korvanneet liukuvan ikkunan lähestymistavan.

Aluepohjaiset menetelmät: Selective Search & Region Proposal Networks (RPN)

Tehokkuuden parantamiseksi aluepohjaiset menetelmät ehdottavat kiinnostusalueita (RoI, Regions of Interest) koko kuvan läpikäymisen sijaan. Kaksi keskeistä tekniikkaa ovat:

  • Selective search: perinteinen lähestymistapa, jossa samankaltaiset pikselit ryhmitellään alue-ehdotuksiksi, mikä vähentää ennustettavien rajauslaatikoiden määrää. Vaikka se on tehokkaampi kuin liukuva ikkuna, se on silti hidas;

  • Region proposal networks (RPN): Faster R-CNN -mallissa käytettävä menetelmä, jossa neuroverkko tuottaa mahdollisia kohdealueita suoraan, mikä parantaa nopeutta ja tarkkuutta merkittävästi verrattuna selective search -menetelmään.

Varhaiset syväoppimiseen perustuvat lähestymistavat

Syväoppiminen mullisti objektien tunnistuksen tuomalla konvoluutiohermoverkot (CNN, convolutional neural networks) osaksi tunnistusputkia. Joitakin uraauurtavia malleja ovat:

  • R-CNN (Regions with CNNs): tässä menetelmässä CNN:tä sovelletaan jokaiseen selective searchin tuottamaan alue-ehdotukseen. Vaikka tarkkuus on huomattavasti parempi kuin perinteisissä menetelmissä, laskennallinen hitaus johtuu toistuvista CNN-laskelmista;

  • Fast R-CNN: parannus R-CNN:ään verrattuna, tässä mallissa koko kuva käsitellään ensin CNN:llä ja sen jälkeen RoI-poolaus poimii piirteet luokittelua varten, mikä nopeuttaa tunnistusta;

  • Faster R-CNN: esittelee region proposal networks (RPN), jotka korvaavat selective searchin, tehden objektien tunnistuksesta nopeampaa ja tarkempaa integroimalla alue-ehdotusten generoinnin suoraan neuroverkkoon.

Objektien tunnistus rakentuu luokittelun ja paikannuksen pohjalle, mahdollistaen useiden kohteiden tunnistamisen yhdessä kuvassa. Perinteiset menetelmät, kuten liukuvat ikkunat, on korvattu tehokkaammilla aluepohjaisilla tekniikoilla, kuten R-CNN ja sen seuraajat. Faster R-CNN, joka hyödyntää region proposal networks -menetelmää, edustaa merkittävää askelta kohti reaaliaikaista ja tarkkaa objektien tunnistusta. Edetessämme tutustumme kehittyneempiin menetelmiin, kuten YOLO ja SSD, jotka edelleen parantavat tunnistuksen nopeutta ja tehokkuutta.

1. Mikä on Faster R-CNN:n tärkein etu verrattuna Fast R-CNN:ään?

2. Miksi liukuva ikkuna -menetelmä on tehoton objektintunnistuksessa?

3. Mikä seuraavista on syväoppimiseen perustuva objektintunnistusmenetelmä?

question mark

Mikä on Faster R-CNN:n tärkein etu verrattuna Fast R-CNN:ään?

Select the correct answer

question mark

Miksi liukuva ikkuna -menetelmä on tehoton objektintunnistuksessa?

Select the correct answer

question mark

Mikä seuraavista on syväoppimiseen perustuva objektintunnistusmenetelmä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 2
Pahoittelemme, että jotain meni pieleen. Mitä tapahtui?
some-alt