Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Tensorien Sovellukset | Tensorit
Johdanto TensorFlow'hun

bookTensorien Sovellukset

Tensorien sovellukset

Tensorit, moniulotteisen rakenteensa ansiosta, soveltuvat laajasti erilaisiin datatehtäviin. Niiden rakenne ja muoto ovat keskeisiä määriteltäessä, miten ne esittävät ja käsittelevät dataa eri tilanteissa. Tarkastellaan seuraavia esimerkkejä:

  • Taulukkodata: usein esitetään 2D-tensoreina, taulukkodata muistuttaa matriiseja. Jokainen rivi voi edustaa yksittäistä havaintoa ja jokainen sarake tietyn ominaisuuden tai attribuutin arvoa. Esimerkiksi tietojoukko, jossa on 1000 näytettä ja 10 ominaisuutta, esitetään tensorilla, jonka muoto on (1000, 10);
  • Tekstijonot: jonoja, kuten aikasarjoja tai tekstidataa, kuvataan tyypillisesti 2D-tensoreilla. Toinen ulottuvuus kuvaa aikaa tai pituutta, kun taas toinen ilmaisee ominaisuudet kussakin aikaleimassa. 200 sanan teksti, jota käsitellään upotuksilla (embeddings), joiden koko on 50, muunnetaan tensoriksi, jonka muoto on (200, 50);
Note
Huomio

Upotukset (embeddings) tekstinkäsittelyssä ovat tapa muuntaa sanat numeerisiksi vektoreiksi siten, että samankaltaiset sanat saavat samankaltaiset vektoriarvot. Tämä mahdollistaa tietokoneiden paremman kyvyn ymmärtää ja käsitellä tekstidataa, koska semanttiset suhteet sanojen välillä säilyvät. Tässä esimerkissä jokainen sana muunnetaan vektoriksi, jonka pituus on 50, eli jokainen sana esitetään 50:llä liukuluvulla.

  • Numeeriset jaksot: tilanteissa, kuten useiden järjestelmäparametrien seurannassa ajan kuluessa, voidaan käyttää 2D-tensoreita. Esimerkiksi ohjausjärjestelmässä, jossa tarkkaillaan 5 eri parametrin (esim. lämpötila, paine, kosteus, jännite ja virta) käyttäytymistä 10 tunnin aikana. Jokaisesta parametrista tallennetaan 40 datapistettä tunnissa. 10 tunnin aikana tämä muodostaa tensorin, jonka muoto on (400, 5). Tässä muodossa ensimmäinen ulottuvuus seuraa aikajanaa järjestyksessä (jokaiselle 40 tunnille 10 datapistettä, yhteensä 400), kun taas toinen ulottuvuus sisältää kunkin 5 parametrin tiedot jokaisessa datapisteessä;
  • Kuvankäsittely: kuvat esitetään pääasiassa 3D-tensoreina. Kuvan korkeus ja leveys muodostavat kaksi ensimmäistä ulottuvuutta, kun taas syvyys (värikanavat kuten RGB) muodostaa kolmannen. Värillisellä kuvalla, jonka koko on 256x256 pikseliä, tensorin muoto on (256, 256, 3);
Note
Huomio

Viimeisen ulottuvuuden pituus on 3, koska jokainen pikseli RGB-väripaletissa esitetään kolmella erillisellä arvolla, jotka vastaavat sen värikanavia: Red, Green ja Blue.

  • Videonkäsittely: videot, jotka koostuvat kuvajonoista, esitetään 4-ulotteisina tensoreina. Ajattele jokaista ruutua kuvana. Esimerkiksi 60 sekunnin video, jossa on 1 ruutu sekunnissa ja jokainen ruutu on 256x256 värikuva, esitetään tensorina muodossa (60, 256, 256, 3).
Note
Huomio

Videolle, jossa on 30 ruutua sekunnissa, kokonaisruutujen määrä on 30 * number of seconds. Eli 60 sekunnin kohdalla tämä tarkoittaa 30 ruutua/sekunti kerrottuna 60 sekunnilla, mikä antaa yhteensä 1800 ruutua. Tämä johtaa tensorin muotoon (1800, 256, 256, 3).

Näiden muotojen ja niiden logiikan ymmärtäminen on olennaista. Oikeilla tensorin ulottuvuuksilla varmistetaan datan asianmukainen kohdistus, mikä luo perustan tehokkaalle mallin koulutukselle ja päättelylle.

1. Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

2. Romaani käsitellään sana kerrallaan, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

3. Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokaisella tunnilla on 30 tietopistettä kutakin mittaria kohden, mikä olisi tensorin muoto?

4. Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tensorin muoto, joka kuvaa tätä dataa?

question mark

Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

Select the correct answer

question mark

Romaani käsitellään sana kerrallaan, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

Select the correct answer

question mark

Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokaisella tunnilla on 30 tietopistettä kutakin mittaria kohden, mikä olisi tensorin muoto?

Select the correct answer

question mark

Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tensorin muoto, joka kuvaa tätä dataa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain more about how tensors are used in deep learning?

What are some other real-world examples where tensors are applied?

How do you determine the right tensor shape for a specific data type?

Awesome!

Completion rate improved to 5.56

bookTensorien Sovellukset

Pyyhkäise näyttääksesi valikon

Tensorien sovellukset

Tensorit, moniulotteisen rakenteensa ansiosta, soveltuvat laajasti erilaisiin datatehtäviin. Niiden rakenne ja muoto ovat keskeisiä määriteltäessä, miten ne esittävät ja käsittelevät dataa eri tilanteissa. Tarkastellaan seuraavia esimerkkejä:

  • Taulukkodata: usein esitetään 2D-tensoreina, taulukkodata muistuttaa matriiseja. Jokainen rivi voi edustaa yksittäistä havaintoa ja jokainen sarake tietyn ominaisuuden tai attribuutin arvoa. Esimerkiksi tietojoukko, jossa on 1000 näytettä ja 10 ominaisuutta, esitetään tensorilla, jonka muoto on (1000, 10);
  • Tekstijonot: jonoja, kuten aikasarjoja tai tekstidataa, kuvataan tyypillisesti 2D-tensoreilla. Toinen ulottuvuus kuvaa aikaa tai pituutta, kun taas toinen ilmaisee ominaisuudet kussakin aikaleimassa. 200 sanan teksti, jota käsitellään upotuksilla (embeddings), joiden koko on 50, muunnetaan tensoriksi, jonka muoto on (200, 50);
Note
Huomio

Upotukset (embeddings) tekstinkäsittelyssä ovat tapa muuntaa sanat numeerisiksi vektoreiksi siten, että samankaltaiset sanat saavat samankaltaiset vektoriarvot. Tämä mahdollistaa tietokoneiden paremman kyvyn ymmärtää ja käsitellä tekstidataa, koska semanttiset suhteet sanojen välillä säilyvät. Tässä esimerkissä jokainen sana muunnetaan vektoriksi, jonka pituus on 50, eli jokainen sana esitetään 50:llä liukuluvulla.

  • Numeeriset jaksot: tilanteissa, kuten useiden järjestelmäparametrien seurannassa ajan kuluessa, voidaan käyttää 2D-tensoreita. Esimerkiksi ohjausjärjestelmässä, jossa tarkkaillaan 5 eri parametrin (esim. lämpötila, paine, kosteus, jännite ja virta) käyttäytymistä 10 tunnin aikana. Jokaisesta parametrista tallennetaan 40 datapistettä tunnissa. 10 tunnin aikana tämä muodostaa tensorin, jonka muoto on (400, 5). Tässä muodossa ensimmäinen ulottuvuus seuraa aikajanaa järjestyksessä (jokaiselle 40 tunnille 10 datapistettä, yhteensä 400), kun taas toinen ulottuvuus sisältää kunkin 5 parametrin tiedot jokaisessa datapisteessä;
  • Kuvankäsittely: kuvat esitetään pääasiassa 3D-tensoreina. Kuvan korkeus ja leveys muodostavat kaksi ensimmäistä ulottuvuutta, kun taas syvyys (värikanavat kuten RGB) muodostaa kolmannen. Värillisellä kuvalla, jonka koko on 256x256 pikseliä, tensorin muoto on (256, 256, 3);
Note
Huomio

Viimeisen ulottuvuuden pituus on 3, koska jokainen pikseli RGB-väripaletissa esitetään kolmella erillisellä arvolla, jotka vastaavat sen värikanavia: Red, Green ja Blue.

  • Videonkäsittely: videot, jotka koostuvat kuvajonoista, esitetään 4-ulotteisina tensoreina. Ajattele jokaista ruutua kuvana. Esimerkiksi 60 sekunnin video, jossa on 1 ruutu sekunnissa ja jokainen ruutu on 256x256 värikuva, esitetään tensorina muodossa (60, 256, 256, 3).
Note
Huomio

Videolle, jossa on 30 ruutua sekunnissa, kokonaisruutujen määrä on 30 * number of seconds. Eli 60 sekunnin kohdalla tämä tarkoittaa 30 ruutua/sekunti kerrottuna 60 sekunnilla, mikä antaa yhteensä 1800 ruutua. Tämä johtaa tensorin muotoon (1800, 256, 256, 3).

Näiden muotojen ja niiden logiikan ymmärtäminen on olennaista. Oikeilla tensorin ulottuvuuksilla varmistetaan datan asianmukainen kohdistus, mikä luo perustan tehokkaalle mallin koulutukselle ja päättelylle.

1. Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

2. Romaani käsitellään sana kerrallaan, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

3. Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokaisella tunnilla on 30 tietopistettä kutakin mittaria kohden, mikä olisi tensorin muoto?

4. Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tensorin muoto, joka kuvaa tätä dataa?

question mark

Sinulla on potilasrekisteritaulukko, jossa on 500 potilasta. Jokaisessa tietueessa on 8 ominaisuutta, kuten ikä, veriryhmä, pituus ja paino. Mikä on tensorin muoto, joka kuvaa näitä tietoja?

Select the correct answer

question mark

Romaani käsitellään sana kerrallaan, ja siinä on yhteensä 1000 sanaa. Jos jokainen sana esitetään 20 kokoisella upotuksella, mikä tensorin muoto kuvaa näitä tietoja?

Select the correct answer

question mark

Ympäristön seurantajärjestelmä tallentaa tietoja neljästä eri mittarista (kuten CO2-taso, lämpötila, kosteus ja ilmanpaine) 12 tunnin ajan. Jos jokaisella tunnilla on 30 tietopistettä kutakin mittaria kohden, mikä olisi tensorin muoto?

Select the correct answer

question mark

Sinulla on koneoppimisprojektia varten 200 harmaasävykuvan tietoaineisto. Jokainen kuva on 128x128 pikseliä. Harmaasävykuvissa on vain 1 kanava. Mikä on tensorin muoto, joka kuvaa tätä dataa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 4
some-alt