Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Gradient Tape | Sezione
Deep Learning con TensorFlow
Sezione 1. Capitolo 13
single

single

bookGradient Tape

Scorri per mostrare il menu

Comprendere le operazioni fondamentali sui tensori consente di procedere verso la semplificazione e l'accelerazione di questi processi utilizzando le funzionalità integrate di TensorFlow. Il primo di questi strumenti avanzati da esplorare è il Gradient Tape.

Cos'è il Gradient Tape?

Questo capitolo approfondisce uno dei concetti fondamentali in TensorFlow, il Gradient Tape. Questa funzionalità è essenziale per comprendere e implementare le tecniche di ottimizzazione basate sul gradiente, in particolare nel deep learning.

Il Gradient Tape in TensorFlow è uno strumento che registra le operazioni per la differenziazione automatica. Quando le operazioni vengono eseguite all'interno di un blocco Gradient Tape, TensorFlow tiene traccia di tutti i calcoli effettuati. Questo è particolarmente utile per l'addestramento dei modelli di machine learning, dove sono necessari i gradienti per ottimizzare i parametri del modello.

Note
Nota

Fondamentalmente, un gradiente è un insieme di derivate parziali.

Utilizzo di Gradient Tape

Per utilizzare Gradient Tape, seguire questi passaggi:

  • Creare un blocco Gradient Tape: utilizzare with tf.GradientTape() as tape:. All'interno di questo blocco, tutti i calcoli vengono tracciati;
  • Definire i calcoli: eseguire operazioni con tensori all'interno del blocco (ad esempio, definire un passaggio in avanti di una rete neurale);
  • Calcolare i gradienti: utilizzare tape.gradient(target, sources) per calcolare i gradienti del target rispetto alle sorgenti.

Calcolo semplice del gradiente

Un esempio semplice per comprendere meglio questo concetto.

123456789101112131415
import tensorflow as tf # Define input variables x = tf.Variable(3.0) # Start recording the operations with tf.GradientTape() as tape: # Define the calculations y = x * x # Extract the gradient for the specific input (`x`) grad = tape.gradient(y, x) print(f'Result of y: {y}') print(f'The gradient of y with respect to x is: {grad.numpy()}')
copy

Questo codice calcola il gradiente di y = x^2 in x = 3. Questo equivale alla derivata parziale di y rispetto a x.

Diverse Derivate Parziali

Quando l'output è influenzato da più input, è possibile calcolare una derivata parziale rispetto a ciascuno di questi input (o solo ad alcuni selezionati). Questo si ottiene fornendo un elenco di variabili come parametro sources.

L'output di questa operazione sarà un corrispondente elenco di tensori, dove ogni tensore rappresenta la derivata parziale rispetto a ciascuna delle variabili specificate in sources.

1234567891011121314151617
import tensorflow as tf # Define input variables x = tf.Variable(tf.fill((2, 3), 3.0)) z = tf.Variable(5.0) # Start recording the operations with tf.GradientTape() as tape: # Define the calculations y = tf.reduce_sum(x * x + 2 * z) # Extract the gradient for the specific inputs (`x` and `z`) grad = tape.gradient(y, [x, z]) print(f'Result of y: {y}') print(f"The gradient of y with respect to x is:\n{grad[0].numpy()}") print(f"The gradient of y with respect to z is: {grad[1].numpy()}")
copy

Questo codice calcola il gradiente della funzione y = sum(x^2 + 2*z) per valori dati di x e z. In questo esempio, il gradiente di x è mostrato come un tensore 2D, dove ogni elemento corrisponde alla derivata parziale del rispettivo valore nella matrice originale x.

Note
Nota

Per ulteriori approfondimenti sulle funzionalità di Gradient Tape, inclusi derivati di ordine superiore ed estrazione della matrice Jacobiana, consultare la documentazione TensorFlow.

Compito

Swipe to start coding

L'obiettivo è calcolare il gradiente (derivata) di una funzione matematica data in un punto specificato utilizzando il Gradient Tape di TensorFlow. Verranno forniti la funzione e il punto, e vedrai come utilizzare TensorFlow per trovare il gradiente in quel punto.

Considera una funzione quadratica di una sola variabile x, definita come:

f(x) = x^2 + 2x - 1

Il compito è calcolare la derivata di questa funzione in x = 2.

Passaggi

  1. Definire la variabile x nel punto in cui si desidera calcolare la derivata.
  2. Utilizzare Gradient Tape per registrare il calcolo della funzione f(x).
  3. Calcolare il gradiente di f(x) nel punto specificato.

Nota

Il gradiente può essere calcolato solo per valori di tipo floating-point.

Derivative of a Function at a Point

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 13
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

some-alt