single
Transformationer
Stryg for at vise menuen
Tensortransformationer er afgørende ved håndtering af data. Når man arbejder dybere med deep learning og datavidenskab, bliver det tydeligt, at de data, man møder, ikke altid er i det ønskede format. Denne lektion introducerer metoder i TensorFlow, der muliggør manipulation af struktur og indhold i tensores for at opfylde specifikke krav.
Omformning af tensores
Ved arbejde med tensores vil der være situationer, hvor det er nødvendigt at ændre formen uden at ændre de underliggende data. tf.reshape() er nyttig i sådanne tilfælde.
Sådan fungerer det:
- Omformning ændrer tensorens struktur, men ikke dens data. Det samlede antal elementer før og efter omformningen skal forblive det samme;
- Funktionen "fylder" den nye form rækkevis (fra venstre mod højre, fra top til bund).
1234567891011121314import tensorflow as tf # Create a tensor with shape (3, 2) tensor = tf.constant([[1, 2], [3, 4], [5, 6]]) # Reshape the tensor to shape (2, 3) reshaped_tensor = tf.reshape(tensor, (2, 3)) print(reshaped_tensor) print('-' * 50) # Reshape the tensor to shape (6, 1); # The size of the first dimention is determined automatically reshaped_tensor = tf.reshape(tensor, (-1, 1)) print(reshaped_tensor)
Når du angiver den nye form, kan én dimension være -1. TensorFlow beregner størrelsen af denne dimension, så den samlede størrelse forbliver konstant.
Dette er særligt nyttigt, når du vil give tensores til et neuralt netværk, men dimensionerne ikke matcher netværkets inputform.
Udskæring
Udskæring hjælper dig med at hente en del af en tensor. Det svarer til Python's listeudskæring, men udvidet til multi-dimensionelle tensores.
Sådan fungerer det:
tf.slice()udtrækker et udsnit fra en tensor. Det kræver startindekset for udsnittet og størrelsen af udsnittet;- Hvis størrelsen er
-1, angiver det alle elementer i den dimension.
12345678910111213import tensorflow as tf # Create a tensor tensor = tf.constant([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # Slice tensor to extract sub-tensor from index (0, 1) of size (1, 2) sliced_tensor = tf.slice(tensor, begin=(0, 1), size=(1, 2)) print(sliced_tensor) print('-' * 50) # Slice tensor to extract sub-tensor from index (1, 0) of size (2, 2) sliced_tensor = tf.slice(tensor, (1, 0), (2, 2)) print(sliced_tensor)
Husk altid nul-baseret indeksering i TensorFlow, hvilket svarer til Pythons egen indeksering. Nyttigt til udtræk af specifikke funktioner eller datapunkter fra et større datasæt.
Ændring af data
Der findes en anden metode til slicing, som også tillader ændring af de oprindelige data, svarende til slicing af arrays i NumPy.
Sådan fungerer det:
- Ved at bruge
[]kan du nemt slice og indeksere tensores, ligesom NumPy slicing. Denne metode gør det muligt at vælge specifikke rækker, kolonner eller elementer af en tensor; - Med
tf.Variable()bliver tensoren muterbar, hvilket tillader direkte ændringer ved hjælp af slicing; - For at ændre værdierne i den valgte subtensor, anvendes metoden
.assign()med en tensor eller liste, der matcher dens form.
12345678910111213import tensorflow as tf # Create a mutable tensor tensor = tf.Variable([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # Change the entire first row tensor[0, :].assign([0, 0, 0]) print(tensor) print('-' * 80) # Modify the second and the third columns tensor[:, 1:3].assign(tf.fill((3,2), 1)) print(tensor)
- Slicingsyntaksen i TensorFlow er i høj grad inspireret af NumPy, så hvis du er bekendt med NumPy, er overgangen til TensorFlows slicemekanisme ligetil;
- Sørg altid for at bruge
tf.Variable()til operationer, der kræver tensor-mutabilitet.
Sammenkædning
Sammenkædning gør det muligt at forene flere tensorer langs en specificeret akse.
Sådan fungerer det:
tf.concat()kombinerer tensorer. Metoden kræver en liste af tensorer, du ønsker at sammenkæde, samt aksen, hvor operationen skal udføres;- Aksen er nul-baseret. En akse på
0refererer til rækker (vertikalt), og en akse på1refererer til kolonner (horisontalt).
123456789101112131415161718import tensorflow as tf # Create two tensors tensor1 = tf.constant([[1, 2, 3], [4, 5, 6]]) tensor2 = tf.constant([[7, 8, 9]]) # Concatenate tensors vertically (along rows) concatenated_tensor = tf.concat([tensor1, tensor2], axis=0) print(concatenated_tensor) print('-' * 50) # Create another set of tensors tensor3 = tf.constant([[1, 2], [4, 5]]) tensor4 = tf.constant([[3], [6]]) # Concatenate tensors horizontally (along columns) concatenated_tensor = tf.concat([tensor3, tensor4], axis=1) print(concatenated_tensor)
- Sørg for, at de tensorer, du sammenføjer, har matchende dimensioner på de ikke-sammenkædede akser;
- Denne operation ligner
numpy.concatenate(), men er tilpasset TensorFlow-tensorer.
Swipe to start coding
Du arbejder med et datasæt bestående af målinger fra forskellige sensorer placeret på forskellige geografiske lokationer. Disse sensorer registrerer vejrrelaterede data såsom temperatur, tryk og normaliserede geografiske koordinater.
Dog har du under sammenstillingen af målingerne opdaget, at nogle af dataene er blevet registreret forkert.
Du har også modtaget nye målinger fra andre sensorer, som skal inkluderes.
Information om datasættet
-
main_dataset: En tensor med formen(6, 4), der repræsenterer 6 målinger. Hver række er en prøve, og kolonnerne repræsenterer følgende egenskaber:- Temperatur (i Celsius);
- Tryk (i hPa);
- Normaliseret breddegrad;
- Normaliseret længdegrad.
-
error_correction_data: En tensor med formen(2, 4), der repræsenterer 2 korrigerede målinger for fejlagtige data i hoveddatasættet. -
additional_data: En tensor med formen(3, 4), der repræsenterer 3 nye målinger.
Formål
Forbered et korrigeret og komplet datasæt til vejrudsigtsformål:
-
Datakorrigering:
- Du har opdaget, at målingerne på 2. og 5. række i
main_datasetvar unøjagtige. Erstat disse rækker imain_datasetmed rækkerne fraerror_correction_data.
- Du har opdaget, at målingerne på 2. og 5. række i
-
Inkludering af yderligere data:
- Sammenkæd
main_datasetmedadditional_datafor at inkludere de nye målinger.
- Sammenkæd
-
Batch-omformning:
- Til batch-træning ønskes datasættet opdelt i batches med 3 målinger per batch. Omform
complete_dataset, hvor den første dimension repræsenterer batch-størrelsen, og den anden dimension repræsenterer antal målinger per batch.
- Til batch-træning ønskes datasættet opdelt i batches med 3 målinger per batch. Omform
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat