Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Muunnokset | Osio
Syväoppiminen TensorFlow'lla
Osio 1. Luku 10
single

single

bookMuunnokset

Pyyhkäise näyttääksesi valikon

Tensorimuunnokset ovat olennaisia tietojen käsittelyssä. Syventyessäsi syväoppimiseen ja datatieteen tehtäviin käy ilmi, että kohdattava data ei aina ole halutussa muodossa. Tässä luvussa esitellään TensorFlow'n menetelmiä, joiden avulla voidaan muokata tensorien rakennetta ja sisältöä vastaamaan erityisiä vaatimuksia.

Tensorien uudelleenmuotoilu

Tensorien kanssa työskennellessä on tilanteita, joissa täytyy muuttaa muotoa ilman, että itse data muuttuu. tf.reshape() on hyödyllinen tällaisissa tilanteissa.

Toimintaperiaate:

  • Uudelleenmuotoilu muuttaa tensorin rakennetta, mutta ei sen dataa. Alkioiden kokonaismäärän ennen ja jälkeen uudelleenmuotoilun täytyy pysyä samana;
  • Toiminto täyttää uuden muodon riveittäin (vasemmalta oikealle, ylhäältä alas).
1234567891011121314
import tensorflow as tf # Create a tensor with shape (3, 2) tensor = tf.constant([[1, 2], [3, 4], [5, 6]]) # Reshape the tensor to shape (2, 3) reshaped_tensor = tf.reshape(tensor, (2, 3)) print(reshaped_tensor) print('-' * 50) # Reshape the tensor to shape (6, 1); # The size of the first dimention is determined automatically reshaped_tensor = tf.reshape(tensor, (-1, 1)) print(reshaped_tensor)
copy
Note
Huomio

Uutta muotoa määritettäessä yksi ulottuvuus voi olla -1. TensorFlow laskee kyseisen ulottuvuuden koon niin, että kokonaiskoko pysyy muuttumattomana.

Tämä on erityisen hyödyllistä, kun haluat syöttää tensoreita neuroverkkoon, mutta ulottuvuudet eivät vastaa verkon syötteen muotoa.

Viipalointi

Viipalointi mahdollistaa tietyn osan tensorista hakemisen. Se muistuttaa Pythonin listojen viipalointia, mutta toimii monidimensioisille tensoreille.

Toimintaperiaate:

  • tf.slice() poimii viipaleen tensorista. Se vaatii viipaleen aloitusindeksin ja viipaleen koon;
  • Jos koko on -1, se tarkoittaa kaikkia kyseisen ulottuvuuden alkioita.
12345678910111213
import tensorflow as tf # Create a tensor tensor = tf.constant([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # Slice tensor to extract sub-tensor from index (0, 1) of size (1, 2) sliced_tensor = tf.slice(tensor, begin=(0, 1), size=(1, 2)) print(sliced_tensor) print('-' * 50) # Slice tensor to extract sub-tensor from index (1, 0) of size (2, 2) sliced_tensor = tf.slice(tensor, (1, 0), (2, 2)) print(sliced_tensor)
copy
Note
Huomio

Muista aina TensorFlown nollapohjainen indeksointi, joka on samanlainen kuin Pythonin oma indeksointi. Hyödyllinen tiettyjen ominaisuuksien tai datapisteiden poimimiseen suuremmasta tietojoukosta.

Datan muokkaaminen

On olemassa toinen viipalointitapa, joka mahdollistaa myös alkuperäisen datan muokkaamisen, vastaavasti kuin NumPyn taulukoiden viipalointi.

Toimintaperiaate:

  • Käyttämällä [] voit helposti viipaloida ja indeksoida tensoreita, samoin kuin NumPyssa. Tällä tavalla voit valita tiettyjä rivejä, sarakkeita tai tensorin alkioita;
  • Kun käytät tf.Variable(), tensorista tulee muokattava, jolloin voit tehdä suoria muutoksia viipaloinnin avulla;
  • Muokataksesi valitun alatensorin arvoja, käytä .assign()-metodia tensorilla tai listalla, jonka muoto vastaa alatensorin muotoa.
12345678910111213
import tensorflow as tf # Create a mutable tensor tensor = tf.Variable([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # Change the entire first row tensor[0, :].assign([0, 0, 0]) print(tensor) print('-' * 80) # Modify the second and the third columns tensor[:, 1:3].assign(tf.fill((3,2), 1)) print(tensor)
copy
Note
Huomio
  • TensorFlow'n viipalointisyntaksi perustuu suurelta osin NumPyn syntaksiin, joten jos tunnet NumPyn, siirtyminen TensorFlow'n viipalointimekanismiin on suoraviivaista;
  • Käytä aina tf.Variable()-funktiota operaatioissa, jotka vaativat tensorin muokattavuutta.

Yhdistäminen (Concatenating)

Yhdistäminen mahdollistaa useiden tensorien liittämisen tietyn akselin mukaan.

Toimintaperiaate:

  • tf.concat() yhdistää tensorit. Menetelmä vaatii listan tensoreista, jotka haluat yhdistää, sekä akselin, jonka mukaan operaatio suoritetaan;
  • Akseli on nollapohjainen. Akseli 0 viittaa riveihin (pystysuunnassa) ja akseli 1 viittaa sarakkeisiin (vaakasuunnassa).
123456789101112131415161718
import tensorflow as tf # Create two tensors tensor1 = tf.constant([[1, 2, 3], [4, 5, 6]]) tensor2 = tf.constant([[7, 8, 9]]) # Concatenate tensors vertically (along rows) concatenated_tensor = tf.concat([tensor1, tensor2], axis=0) print(concatenated_tensor) print('-' * 50) # Create another set of tensors tensor3 = tf.constant([[1, 2], [4, 5]]) tensor4 = tf.constant([[3], [6]]) # Concatenate tensors horizontally (along columns) concatenated_tensor = tf.concat([tensor3, tensor4], axis=1) print(concatenated_tensor)
copy
Note
Huomio
  • Varmista, että yhdistettävillä tensoreilla on yhteensopivat dimensiot muilla kuin liitettävillä akseleilla;
  • Tämä operaatio muistuttaa numpy.concatenate()-funktiota, mutta on suunniteltu erityisesti TensorFlow-tensoreille.
Tehtävä

Swipe to start coding

Työskentelet erilaisista sensoreista kerätyn lukemadatan parissa, jossa sensorit on sijoitettu eri maantieteellisiin sijainteihin. Nämä sensorit tallentavat säähän liittyviä tietoja, kuten lämpötilaa, ilmanpainetta sekä normalisoituja maantieteellisiä koordinaatteja.

Kuitenkin havaitsit, että osa datasta on tallennettu virheellisesti.

Lisäksi olet saanut uusia lukemia muilta sensoreilta, jotka tulee sisällyttää aineistoon.

Datan tiedot

  1. main_dataset: Tensorin muoto on (6, 4), eli 6 lukemaa. Jokainen rivi on yksi näyte, ja sarakkeet kuvaavat seuraavia ominaisuuksia:

    • Lämpötila (Celsius-asteina);
    • Ilmanpaine (hPa);
    • Normalisoitu leveysasteen koordinaatti;
    • Normalisoitu pituusasteen koordinaatti.
  2. error_correction_data: Tensorin muoto on (2, 4), eli 2 korjattua lukemaa virheellisten tietojen tilalle pääaineistossa.

  3. additional_data: Tensorin muoto on (3, 4), eli 3 uutta lukemaa.

Tavoite

Valmistele korjattu ja täydellinen aineisto sääennustetta varten:

  1. Datan korjaus:

    • Havaitsit, että main_dataset-tietojoukon 2. ja 5. rivin lukemat olivat virheellisiä.
    • Korvaa main_dataset-tietojoukon 2. ja 5. rivit error_correction_data-tietojoukon riveillä.
  2. Lisäaineiston yhdistäminen:

    • Yhdistä main_dataset ja additional_data lisäämällä uudet lukemat aineistoon.
  3. Erien uudelleenmuotoilu:

    • Eräopetusta varten haluat jakaa aineiston eriin, joissa on 3 lukemaa per erä. Muotoile complete_dataset siten, että ensimmäinen ulottuvuus kuvaa eräkokoa ja toinen ulottuvuus lukemien määrää per erä.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 10
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

some-alt