Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Tensorien Sovellukset | Tensorit
Johdanto TensorFlow'hun

bookTensorien Sovellukset

Tensorien sovellukset

Tensorit, moniulotteisen rakenteensa ansiosta, soveltuvat laajasti erilaisiin datan käsittelytehtäviin. Niiden rakenne ja muoto ovat keskeisiä määriteltäessä, miten ne esittävät ja käsittelevät dataa eri tilanteissa. Tarkastellaan seuraavia esimerkkejä:

  • Taulukkodata: usein 2D-tensoreina esitetty taulukkodata muistuttaa matriiseja. Jokainen rivi voi edustaa yksittäistä havaintoa, ja jokainen sarake voi kuvata datan ominaisuutta tai attribuuttia. Esimerkiksi tietojoukko, jossa on 1000 näytettä ja 10 ominaisuutta, esitetään tensorilla, jonka muoto on (1000, 10);
  • Tekstijonot: sekvenssidata, kuten aikasarjat tai tekstidata, kuvataan tyypillisesti 2D-tensoreina. Toinen ulottuvuus kuvaa aikaa tai pituutta, kun taas toinen ilmaisee ominaisuudet kussakin aikapisteessä. 200 sanan teksti, joka käsitellään upotuksilla (embeddings) kooltaan 50, muunnetaan tensoriksi, jonka muoto on (200, 50);
Note
Huomio

Upotukset (embeddings) tekstinkäsittelyssä ovat tapa muuntaa sanat numeerisiksi vektoreiksi siten, että samankaltaiset sanat saavat samankaltaisia vektoriarvoja. Tämä mahdollistaa tietokoneiden paremman kyvyn ymmärtää ja käsitellä tekstidataa, koska semanttiset suhteet sanojen välillä säilyvät. Tässä esimerkissä jokainen sana muunnetaan vektoriksi, jonka pituus on 50, eli jokainen sana esitetään 50 liukulukuarvolla.

  • Numeeriset jaksot: tilanteissa, kuten useiden järjestelmäparametrien seuranta ajan kuluessa, voidaan käyttää 2D-tensoreita. Esimerkkinä ohjausjärjestelmä, jossa tarkkaillaan 5 eri parametrin (esim. lämpötila, paine, kosteus, jännite ja virta) käyttäytymistä 10 tunnin ajan. Jokaisesta parametrista tallennetaan 40 datapistettä tunnissa. 10 tunnin aikana tämä muodostaa tensorin, jonka muoto on (400, 5). Tässä muodossa ensimmäinen ulottuvuus seuraa aikajanaa järjestyksessä (jokaiselle 40 tunnille 10 datapistettä, yhteensä 400), kun taas toinen ulottuvuus sisältää kunkin 5 parametrin tiedot jokaisessa datapisteessä;
  • Kuvankäsittely: kuvat esitetään pääasiassa 3D-tensoreina. Kuvan korkeus ja leveys muodostavat kaksi ensimmäistä ulottuvuutta, kun taas syvyys (värikanavat kuten RGB) muodostaa kolmannen. Värillisellä kuvalla, jonka koko on 256x256 pikseliä, tensorin muoto on (256, 256, 3);
Note
Huomio

Viimeisen ulottuvuuden pituus on 3, koska jokainen RGB-väripaletin pikseli on esitetty kolmella erillisellä arvolla, jotka vastaavat sen värikanavia: Red, Green ja Blue.

  • Videonkäsittely: videot, jotka koostuvat kuvajonoista, esitetään 4-ulotteisina tensoreina. Ajattele jokaista ruutua kuvana. Esimerkiksi 60 sekunnin video, joka on näytteistetty 1 ruudulla sekunnissa ja jokainen ruutu on 256x256 värikuva, esitetään tensorina, jonka muoto on (60, 256, 256, 3).
Note
Huomio

Videossa, jossa on 30 ruutua sekunnissa, kokonaisruutujen määrä on 30 * number of seconds. Eli 60 sekunnin videossa tämä tarkoittaa 30 ruutua/sekunti kerrottuna 60 sekunnilla, jolloin saadaan yhteensä 1800 ruutua. Tämä johtaa tensorin muotoon (1800, 256, 256, 3).

Näiden muotojen ja niiden taustalla olevan logiikan ymmärtäminen on olennaista. Kun tensorien dimensiot ovat oikein, data kohdistuu asianmukaisesti, mikä luo perustan tehokkaalle mallin koulutukselle ja päättelylle.

1. Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

2. Romaani käsitellään sana sanalta, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

3. Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokainen tunti sisältää 30 mittaustulosta kutakin mittaria kohden, mikä olisi tensorin muoto?

4. Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on kooltaan 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tämän datan tensorin muoto?

question mark

Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

Select the correct answer

question mark

Romaani käsitellään sana sanalta, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

Select the correct answer

question mark

Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokainen tunti sisältää 30 mittaustulosta kutakin mittaria kohden, mikä olisi tensorin muoto?

Select the correct answer

question mark

Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on kooltaan 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tämän datan tensorin muoto?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 5.56

bookTensorien Sovellukset

Pyyhkäise näyttääksesi valikon

Tensorien sovellukset

Tensorit, moniulotteisen rakenteensa ansiosta, soveltuvat laajasti erilaisiin datan käsittelytehtäviin. Niiden rakenne ja muoto ovat keskeisiä määriteltäessä, miten ne esittävät ja käsittelevät dataa eri tilanteissa. Tarkastellaan seuraavia esimerkkejä:

  • Taulukkodata: usein 2D-tensoreina esitetty taulukkodata muistuttaa matriiseja. Jokainen rivi voi edustaa yksittäistä havaintoa, ja jokainen sarake voi kuvata datan ominaisuutta tai attribuuttia. Esimerkiksi tietojoukko, jossa on 1000 näytettä ja 10 ominaisuutta, esitetään tensorilla, jonka muoto on (1000, 10);
  • Tekstijonot: sekvenssidata, kuten aikasarjat tai tekstidata, kuvataan tyypillisesti 2D-tensoreina. Toinen ulottuvuus kuvaa aikaa tai pituutta, kun taas toinen ilmaisee ominaisuudet kussakin aikapisteessä. 200 sanan teksti, joka käsitellään upotuksilla (embeddings) kooltaan 50, muunnetaan tensoriksi, jonka muoto on (200, 50);
Note
Huomio

Upotukset (embeddings) tekstinkäsittelyssä ovat tapa muuntaa sanat numeerisiksi vektoreiksi siten, että samankaltaiset sanat saavat samankaltaisia vektoriarvoja. Tämä mahdollistaa tietokoneiden paremman kyvyn ymmärtää ja käsitellä tekstidataa, koska semanttiset suhteet sanojen välillä säilyvät. Tässä esimerkissä jokainen sana muunnetaan vektoriksi, jonka pituus on 50, eli jokainen sana esitetään 50 liukulukuarvolla.

  • Numeeriset jaksot: tilanteissa, kuten useiden järjestelmäparametrien seuranta ajan kuluessa, voidaan käyttää 2D-tensoreita. Esimerkkinä ohjausjärjestelmä, jossa tarkkaillaan 5 eri parametrin (esim. lämpötila, paine, kosteus, jännite ja virta) käyttäytymistä 10 tunnin ajan. Jokaisesta parametrista tallennetaan 40 datapistettä tunnissa. 10 tunnin aikana tämä muodostaa tensorin, jonka muoto on (400, 5). Tässä muodossa ensimmäinen ulottuvuus seuraa aikajanaa järjestyksessä (jokaiselle 40 tunnille 10 datapistettä, yhteensä 400), kun taas toinen ulottuvuus sisältää kunkin 5 parametrin tiedot jokaisessa datapisteessä;
  • Kuvankäsittely: kuvat esitetään pääasiassa 3D-tensoreina. Kuvan korkeus ja leveys muodostavat kaksi ensimmäistä ulottuvuutta, kun taas syvyys (värikanavat kuten RGB) muodostaa kolmannen. Värillisellä kuvalla, jonka koko on 256x256 pikseliä, tensorin muoto on (256, 256, 3);
Note
Huomio

Viimeisen ulottuvuuden pituus on 3, koska jokainen RGB-väripaletin pikseli on esitetty kolmella erillisellä arvolla, jotka vastaavat sen värikanavia: Red, Green ja Blue.

  • Videonkäsittely: videot, jotka koostuvat kuvajonoista, esitetään 4-ulotteisina tensoreina. Ajattele jokaista ruutua kuvana. Esimerkiksi 60 sekunnin video, joka on näytteistetty 1 ruudulla sekunnissa ja jokainen ruutu on 256x256 värikuva, esitetään tensorina, jonka muoto on (60, 256, 256, 3).
Note
Huomio

Videossa, jossa on 30 ruutua sekunnissa, kokonaisruutujen määrä on 30 * number of seconds. Eli 60 sekunnin videossa tämä tarkoittaa 30 ruutua/sekunti kerrottuna 60 sekunnilla, jolloin saadaan yhteensä 1800 ruutua. Tämä johtaa tensorin muotoon (1800, 256, 256, 3).

Näiden muotojen ja niiden taustalla olevan logiikan ymmärtäminen on olennaista. Kun tensorien dimensiot ovat oikein, data kohdistuu asianmukaisesti, mikä luo perustan tehokkaalle mallin koulutukselle ja päättelylle.

1. Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

2. Romaani käsitellään sana sanalta, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

3. Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokainen tunti sisältää 30 mittaustulosta kutakin mittaria kohden, mikä olisi tensorin muoto?

4. Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on kooltaan 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tämän datan tensorin muoto?

question mark

Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

Select the correct answer

question mark

Romaani käsitellään sana sanalta, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

Select the correct answer

question mark

Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokainen tunti sisältää 30 mittaustulosta kutakin mittaria kohden, mikä olisi tensorin muoto?

Select the correct answer

question mark

Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on kooltaan 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tämän datan tensorin muoto?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4
some-alt