single
Muunnokset
Pyyhkäise näyttääksesi valikon
Tensorimuunnokset ovat olennaisia tietojen käsittelyssä. Syventyessäsi syväoppimiseen ja datatieteen tehtäviin käy ilmi, että kohdattava data ei aina ole halutussa muodossa. Tässä luvussa esitellään TensorFlow'n menetelmiä, joiden avulla voidaan muokata tensorien rakennetta ja sisältöä vastaamaan erityisiä vaatimuksia.
Tensorien uudelleenmuotoilu
Tensorien kanssa työskennellessä on tilanteita, joissa täytyy muuttaa muotoa ilman, että itse data muuttuu. tf.reshape() on hyödyllinen tällaisissa tilanteissa.
Toimintaperiaate:
- Uudelleenmuotoilu muuttaa tensorin rakennetta, mutta ei sen dataa. Alkioiden kokonaismäärän ennen ja jälkeen uudelleenmuotoilun täytyy pysyä samana;
- Toiminto täyttää uuden muodon riveittäin (vasemmalta oikealle, ylhäältä alas).
1234567891011121314import tensorflow as tf # Create a tensor with shape (3, 2) tensor = tf.constant([[1, 2], [3, 4], [5, 6]]) # Reshape the tensor to shape (2, 3) reshaped_tensor = tf.reshape(tensor, (2, 3)) print(reshaped_tensor) print('-' * 50) # Reshape the tensor to shape (6, 1); # The size of the first dimention is determined automatically reshaped_tensor = tf.reshape(tensor, (-1, 1)) print(reshaped_tensor)
Uutta muotoa määritettäessä yksi ulottuvuus voi olla -1. TensorFlow laskee kyseisen ulottuvuuden koon niin, että kokonaiskoko pysyy muuttumattomana.
Tämä on erityisen hyödyllistä, kun haluat syöttää tensoreita neuroverkkoon, mutta ulottuvuudet eivät vastaa verkon syötteen muotoa.
Viipalointi
Viipalointi mahdollistaa tietyn osan tensorista hakemisen. Se muistuttaa Pythonin listojen viipalointia, mutta toimii monidimensioisille tensoreille.
Toimintaperiaate:
tf.slice()poimii viipaleen tensorista. Se vaatii viipaleen aloitusindeksin ja viipaleen koon;- Jos koko on
-1, se tarkoittaa kaikkia kyseisen ulottuvuuden alkioita.
12345678910111213import tensorflow as tf # Create a tensor tensor = tf.constant([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # Slice tensor to extract sub-tensor from index (0, 1) of size (1, 2) sliced_tensor = tf.slice(tensor, begin=(0, 1), size=(1, 2)) print(sliced_tensor) print('-' * 50) # Slice tensor to extract sub-tensor from index (1, 0) of size (2, 2) sliced_tensor = tf.slice(tensor, (1, 0), (2, 2)) print(sliced_tensor)
Muista aina TensorFlown nollapohjainen indeksointi, joka on samanlainen kuin Pythonin oma indeksointi. Hyödyllinen tiettyjen ominaisuuksien tai datapisteiden poimimiseen suuremmasta tietojoukosta.
Datan muokkaaminen
On olemassa toinen viipalointitapa, joka mahdollistaa myös alkuperäisen datan muokkaamisen, vastaavasti kuin NumPyn taulukoiden viipalointi.
Toimintaperiaate:
- Käyttämällä
[]voit helposti viipaloida ja indeksoida tensoreita, samoin kuin NumPyssa. Tällä tavalla voit valita tiettyjä rivejä, sarakkeita tai tensorin alkioita; - Kun käytät
tf.Variable(), tensorista tulee muokattava, jolloin voit tehdä suoria muutoksia viipaloinnin avulla; - Muokataksesi valitun alatensorin arvoja, käytä
.assign()-metodia tensorilla tai listalla, jonka muoto vastaa alatensorin muotoa.
12345678910111213import tensorflow as tf # Create a mutable tensor tensor = tf.Variable([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # Change the entire first row tensor[0, :].assign([0, 0, 0]) print(tensor) print('-' * 80) # Modify the second and the third columns tensor[:, 1:3].assign(tf.fill((3,2), 1)) print(tensor)
- TensorFlow'n viipalointisyntaksi perustuu suurelta osin NumPyn syntaksiin, joten jos tunnet NumPyn, siirtyminen TensorFlow'n viipalointimekanismiin on suoraviivaista;
- Käytä aina
tf.Variable()-funktiota operaatioissa, jotka vaativat tensorin muokattavuutta.
Yhdistäminen (Concatenating)
Yhdistäminen mahdollistaa useiden tensorien liittämisen tietyn akselin mukaan.
Toimintaperiaate:
tf.concat()yhdistää tensorit. Menetelmä vaatii listan tensoreista, jotka haluat yhdistää, sekä akselin, jonka mukaan operaatio suoritetaan;- Akseli on nollapohjainen. Akseli
0viittaa riveihin (pystysuunnassa) ja akseli1viittaa sarakkeisiin (vaakasuunnassa).
123456789101112131415161718import tensorflow as tf # Create two tensors tensor1 = tf.constant([[1, 2, 3], [4, 5, 6]]) tensor2 = tf.constant([[7, 8, 9]]) # Concatenate tensors vertically (along rows) concatenated_tensor = tf.concat([tensor1, tensor2], axis=0) print(concatenated_tensor) print('-' * 50) # Create another set of tensors tensor3 = tf.constant([[1, 2], [4, 5]]) tensor4 = tf.constant([[3], [6]]) # Concatenate tensors horizontally (along columns) concatenated_tensor = tf.concat([tensor3, tensor4], axis=1) print(concatenated_tensor)
- Varmista, että yhdistettävillä tensoreilla on yhteensopivat dimensiot muilla kuin liitettävillä akseleilla;
- Tämä operaatio muistuttaa
numpy.concatenate()-funktiota, mutta on suunniteltu erityisesti TensorFlow-tensoreille.
Swipe to start coding
Työskentelet erilaisista sensoreista kerätyn lukemadatan parissa, jossa sensorit on sijoitettu eri maantieteellisiin sijainteihin. Nämä sensorit tallentavat säähän liittyviä tietoja, kuten lämpötilaa, ilmanpainetta sekä normalisoituja maantieteellisiä koordinaatteja.
Kuitenkin havaitsit, että osa datasta on tallennettu virheellisesti.
Lisäksi olet saanut uusia lukemia muilta sensoreilta, jotka tulee sisällyttää aineistoon.
Datan tiedot
-
main_dataset: Tensorin muoto on(6, 4), eli 6 lukemaa. Jokainen rivi on yksi näyte, ja sarakkeet kuvaavat seuraavia ominaisuuksia:- Lämpötila (Celsius-asteina);
- Ilmanpaine (hPa);
- Normalisoitu leveysasteen koordinaatti;
- Normalisoitu pituusasteen koordinaatti.
-
error_correction_data: Tensorin muoto on(2, 4), eli 2 korjattua lukemaa virheellisten tietojen tilalle pääaineistossa. -
additional_data: Tensorin muoto on(3, 4), eli 3 uutta lukemaa.
Tavoite
Valmistele korjattu ja täydellinen aineisto sääennustetta varten:
-
Datan korjaus:
- Havaitsit, että
main_dataset-tietojoukon 2. ja 5. rivin lukemat olivat virheellisiä. - Korvaa
main_dataset-tietojoukon 2. ja 5. riviterror_correction_data-tietojoukon riveillä.
- Havaitsit, että
-
Lisäaineiston yhdistäminen:
- Yhdistä
main_datasetjaadditional_datalisäämällä uudet lukemat aineistoon.
- Yhdistä
-
Erien uudelleenmuotoilu:
- Eräopetusta varten haluat jakaa aineiston eriin, joissa on 3 lukemaa per erä. Muotoile
complete_datasetsiten, että ensimmäinen ulottuvuus kuvaa eräkokoa ja toinen ulottuvuus lukemien määrää per erä.
- Eräopetusta varten haluat jakaa aineiston eriin, joissa on 3 lukemaa per erä. Muotoile
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme