Summary  
This chapter introduces how to enable gradient tracking on tensors, build a dynamic computational graph, and compute gradients via backpropagation in PyTorch’s autograd system.

General domain of usage  
Training neural networks

Per ricapitolare, **i gradienti** sono derivate parziali di una funzione rispetto ai suoi input.

Definizione

I gradienti sono fondamentali nei **compiti di ottimizzazione** come l'addestramento delle reti neurali, dove aiutano ad adattare pesi e bias per minimizzare l'errore. In **PyTorch**, vengono calcolati automaticamente tramite il modulo `autograd`, che traccia le operazioni sui tensori e calcola le derivate in modo efficiente.



## Abilitazione del tracciamento dei gradienti
Per abilitare il tracciamento dei gradienti per un tensore, si utilizza l'argomento `requires_grad=True` durante la creazione del tensore. Questo indica a PyTorch di **tracciare tutte le operazioni sul tensore** per il calcolo dei gradienti.

import torch
# Create a tensor with gradient tracking enabled
tensor = torch.tensor(2.0, requires_grad=True)
print(tensor)

## Costruzione di un grafo computazionale

PyTorch costruisce un **grafo computazionale dinamico** mentre si eseguono operazioni su tensori con `requires_grad=True`. Questo grafo memorizza le relazioni tra tensori e operazioni, consentendo la **differenziazione automatica**.

Inizieremo definendo una funzione polinomiale piuttosto semplice:

<p>
  <b style="font-weight: bold">y</b> = 5x<super style="vertical-align: super; font-size: smaller">3</super> + 2x<super style="vertical-align: super; font-size: smaller">2</super> + 4x + 8
</p>



L'obiettivo è calcolare la derivata rispetto a `x` per `x = 2`. 

import torch
# Define the tensor
x = torch.tensor(2.0, requires_grad=True)
# Define the function
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
print(f"Function output: {y}")

La visualizzazione di questo **grafo computazionale** creato utilizzando la libreria **PyTorchViz** può apparire piuttosto complessa, ma trasmette efficacemente l'idea chiave alla base:

## Calcolo dei gradienti

Per calcolare il gradiente, è necessario chiamare il metodo `backward()` sul **tensore di output**. Questo calcola la derivata della funzione rispetto al **tensore di input**.

Il gradiente calcolato può poi essere accessibile tramite l'attributo `.grad`.



import torch
x = torch.tensor(2.0, requires_grad=True)
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
# Perform backpropagation
y.backward()
# Print the gradient of x
grad = x.grad
print(f"Gradient of x: {grad}")

Il gradiente calcolato è la derivata di `y` rispetto a `x`, valutata in `x = 2`.

Come puoi accedere al gradiente calcolato di un tensore dopo la retropropagazione in PyTorch?

Passaggio dalle librerie di alto livello alla flessibilità di PyTorch. Padronanza dei componenti fondamentali del deep learning lavorando con i tensori, la struttura dati principale di PyTorch. Esplorazione della differenziazione automatica con i gradienti, implementazione della retropropagazione e costruzione di reti neurali complete da zero. Gestione di dataset reali e dell'intero ciclo di addestramento, dall'inizializzazione dei pesi alla valutazione del modello.

Gradienti in PyTorch

Abilitazione del tracciamento dei gradienti

Costruzione di un grafo computazionale

Calcolo dei gradienti