Summary  
This chapter introduces how to enable gradient tracking on tensors, build a dynamic computational graph, and compute gradients via backpropagation in PyTorch’s autograd system.

General domain of usage  
Training neural networks

En resumen, los **gradientes** son derivadas parciales de una función con respecto a sus entradas.

Definición

Los gradientes son fundamentales en **tareas de optimización** como el entrenamiento de redes neuronales, donde ayudan a ajustar los pesos y sesgos para minimizar el error. En **PyTorch**, se calculan automáticamente utilizando el módulo `autograd`, que rastrea las operaciones sobre tensores y calcula derivadas de manera eficiente.



## Habilitación del seguimiento de gradientes
Para habilitar el seguimiento de gradientes en un tensor, se utiliza el argumento `requires_grad=True` al crear el tensor. Esto indica a PyTorch que **registre todas las operaciones sobre el tensor** para el cálculo de gradientes.

import torch
# Create a tensor with gradient tracking enabled
tensor = torch.tensor(2.0, requires_grad=True)
print(tensor)

## Construcción de un grafo computacional

PyTorch construye un **grafo computacional dinámico** a medida que se realizan operaciones sobre tensores con `requires_grad=True`. Este grafo almacena las relaciones entre tensores y operaciones, permitiendo la **diferenciación automática**.

Comenzaremos definiendo una función polinómica sencilla:

<p>
  <b style="font-weight: bold">y</b> = 5x<super style="vertical-align: super; font-size: smaller">3</super> + 2x<super style="vertical-align: super; font-size: smaller">2</super> + 4x + 8
</p>



El objetivo es calcular la derivada con respecto a `x` en `x = 2`. 

import torch
# Define the tensor
x = torch.tensor(2.0, requires_grad=True)
# Define the function
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
print(f"Function output: {y}")

La visualización de este **grafo computacional** creado utilizando la biblioteca **PyTorchViz** puede parecer algo compleja, pero transmite de manera efectiva la idea principal detrás de ella:

## Cálculo de Gradientes

Para calcular el gradiente, se debe llamar al método `backward()` sobre el **tensor de salida**. Esto calcula la derivada de la función con respecto al **tensor de entrada**.

El gradiente calculado puede ser accedido mediante el atributo `.grad`.



import torch
x = torch.tensor(2.0, requires_grad=True)
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
# Perform backpropagation
y.backward()
# Print the gradient of x
grad = x.grad
print(f"Gradient of x: {grad}")

El gradiente calculado es la derivada de `y` con respecto a `x`, evaluada en `x = 2`.

¿Cómo se puede acceder al gradiente calculado de un tensor después de la retropropagación en PyTorch?

Transición de bibliotecas de alto nivel a la flexibilidad de PyTorch. Dominio de los componentes fundamentales del aprendizaje profundo mediante el trabajo con tensores, la estructura de datos principal de PyTorch. Exploración de la diferenciación automática con gradientes, implementación de retropropagación y construcción de redes neuronales completas desde cero. Manejo de conjuntos de datos del mundo real y gestión del ciclo completo de entrenamiento, desde la inicialización de pesos hasta la evaluación del modelo.

Gradientes en PyTorch

Habilitación del seguimiento de gradientes

Construcción de un grafo computacional

Cálculo de Gradientes