Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Tensorien Sovellukset | Osio
Syväoppiminen TensorFlow'lla

bookTensorien Sovellukset

Pyyhkäise näyttääksesi valikon

Tensorit, moniulotteisen rakenteensa ansiosta, soveltuvat laajasti erilaisiin datan käsittelytehtäviin. Niiden rakenne ja muoto ovat keskeisiä määriteltäessä, miten ne esittävät ja käsittelevät dataa eri tilanteissa. Tarkastellaan seuraavia esimerkkejä:

  • Taulukkodata: usein 2D-tensoreina esitetty taulukkodata muistuttaa matriiseja. Jokainen rivi voi edustaa yksittäistä havaintoa, ja jokainen sarake voi kuvata datan ominaisuutta tai attribuuttia. Esimerkiksi tietojoukko, jossa on 1000 näytettä ja 10 ominaisuutta, esitetään tensorilla, jonka muoto on (1000, 10);
  • Tekstijonot: sekvenssit, kuten aikasarjat tai tekstidata, kuvataan tyypillisesti 2D-tensoreina. Toinen ulottuvuus kuvaa ajan tai pituuden etenemistä, kun taas toinen ilmaisee ominaisuudet kussakin aikapisteessä. 200 sanan teksti, jota käsitellään upotuksilla (embeddings), joiden koko on 50, muunnetaan tensoriksi, jonka muoto on (200, 50);
Note
Huomio

Upotukset (embeddings) tekstin käsittelyssä ovat tapa muuntaa sanat numeerisiksi vektoreiksi siten, että samankaltaiset sanat saavat samankaltaisia vektoriarvoja. Tämä mahdollistaa tietokoneiden paremman kyvyn ymmärtää ja käsitellä tekstidataa, koska semanttiset suhteet sanojen välillä säilyvät. Tässä esimerkissä jokainen sana muunnetaan vektoriksi, jonka pituus on 50, eli jokainen sana esitetään 50:llä liukuluvulla.

  • Numeeriset jaksot: tilanteissa, kuten useiden järjestelmäparametrien seuranta ajan kuluessa, voidaan käyttää 2D-tensoreita. Esimerkkinä ohjausjärjestelmä, jossa tarkkaillaan 5 eri parametrin (esim. lämpötila, paine, kosteus, jännite ja virta) käyttäytymistä 10 tunnin aikana. Jokaisesta parametrista tallennetaan 40 datapistettä tunnissa. 10 tunnin aikana tämä muodostaa tensorin, jonka muoto on (400, 5). Tässä muodossa ensimmäinen ulottuvuus seuraa aikajanaa (jokaiselle 40 tunnille 10 datapistettä, yhteensä 400), kun taas toinen ulottuvuus sisältää kunkin 5 parametrin tiedot jokaisessa datapisteessä;
  • Kuvankäsittely: kuvat esitetään pääasiassa 3D-tensoreina. Kuvan korkeus ja leveys muodostavat kaksi ensimmäistä ulottuvuutta, kun taas syvyys (värikanavat kuten RGB) muodostaa kolmannen. Värillisellä kuvalla, jonka koko on 256x256 pikseliä, tensorin muoto on (256, 256, 3);
Note
Huomio

Viimeisen ulottuvuuden pituus on 3, koska jokainen pikseli RGB-väripaletissa esitetään kolmella eri arvolla, jotka vastaavat sen värikanavia: Red, Green ja Blue.

  • Videonkäsittely: videot, jotka ovat kuvajonoja, esitetään 4D-tensoreina. Jokainen ruutu voidaan ajatella kuvana. Esimerkiksi 60 sekunnin video, joka on näytteistetty 1 ruudulla sekunnissa ja jossa jokainen ruutu on 256x256 värikuva, esitetään tensorina muodossa (60, 256, 256, 3).
Note
Huomio

Videossa, jossa on 30 ruutua sekunnissa, kokonaisruutujen määrä on 30 * number of seconds. Eli 60 sekunnin kohdalla tämä tarkoittaa 30 ruutua/sekunti kerrottuna 60 sekunnilla, jolloin saadaan yhteensä 1800 ruutua. Tämä johtaa tensorin muotoon (1800, 256, 256, 3).

Näiden muotojen ja niiden taustalla olevan logiikan ymmärtäminen on olennaista. Oikeiden tensorimittojen varmistaminen mahdollistaa datan asianmukaisen kohdistamisen, mikä luo perustan tehokkaalle mallin koulutukselle ja päättelylle.

1. Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

2. Romaani käsitellään sana kerrallaan, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

3. Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokainen tunti sisältää 30 mittauspistettä kutakin mittaria kohden, mikä olisi tensorin muoto?

4. Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on kooltaan 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tämän datan tensori-muoto?

question mark

Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

Select the correct answer

question mark

Romaani käsitellään sana kerrallaan, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

Select the correct answer

question mark

Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokainen tunti sisältää 30 mittauspistettä kutakin mittaria kohden, mikä olisi tensorin muoto?

Select the correct answer

question mark

Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on kooltaan 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tämän datan tensori-muoto?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 4
some-alt