Summary  
This chapter introduces how to enable gradient tracking on tensors, build a dynamic computational graph, and compute gradients via backpropagation in PyTorch’s autograd system.

General domain of usage  
Training neural networks

Para recapitular, **gradientes** são derivadas parciais de uma função em relação às suas entradas.

Definição

Gradientes são fundamentais em **tarefas de otimização** como o treinamento de redes neurais, onde auxiliam no ajuste de pesos e vieses para minimizar o erro. No **PyTorch**, eles são calculados automaticamente utilizando o módulo `autograd`, que rastreia operações em tensores e computa derivadas de forma eficiente.



## Habilitando o Rastreamento de Gradientes
Para habilitar o rastreamento de gradientes para um tensor, utiliza-se o argumento `requires_grad=True` ao criar o tensor. Isso informa ao PyTorch para **rastrear todas as operações no tensor** para o cálculo de gradientes.

import torch
# Create a tensor with gradient tracking enabled
tensor = torch.tensor(2.0, requires_grad=True)
print(tensor)

## Construção de um Grafo Computacional

O PyTorch constrói um **grafo computacional dinâmico** à medida que você realiza operações em tensores com `requires_grad=True`. Esse grafo armazena os relacionamentos entre tensores e operações, permitindo a **diferenciação automática**.

Vamos começar definindo uma função polinomial simples:

<p>
  <b style="font-weight: bold">y</b> = 5x<super style="vertical-align: super; font-size: smaller">3</super> + 2x<super style="vertical-align: super; font-size: smaller">2</super> + 4x + 8
</p>



O objetivo é calcular a derivada em relação a `x` para `x = 2`.

import torch
# Define the tensor
x = torch.tensor(2.0, requires_grad=True)
# Define the function
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
print(f"Function output: {y}")

A visualização deste **grafo computacional** criado utilizando a biblioteca **PyTorchViz** pode parecer um pouco complexa, mas transmite de forma eficaz a ideia principal por trás dele:

## Cálculo de Gradientes

Para calcular o gradiente, o método `backward()` deve ser chamado no **tensor de saída**. Isso calcula a derivada da função em relação ao **tensor de entrada**.

O gradiente calculado pode então ser acessado pelo atributo `.grad`.



import torch
x = torch.tensor(2.0, requires_grad=True)
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
# Perform backpropagation
y.backward()
# Print the gradient of x
grad = x.grad
print(f"Gradient of x: {grad}")

O gradiente calculado é a derivada de `y` em relação a `x`, avaliada em `x = 2`.

Como acessar o gradiente calculado de um tensor após a retropropagação no PyTorch?

Transição de bibliotecas de alto nível para a flexibilidade do PyTorch. Domínio dos blocos fundamentais do deep learning por meio do trabalho com Tensores, a principal estrutura de dados do PyTorch. Exploração de diferenciação automática com gradientes, implementação de retropropagação e construção de redes neurais completas do zero. Aprendizado sobre manipulação de conjuntos de dados do mundo real e gerenciamento de todo o ciclo de treinamento – desde a inicialização dos pesos até a avaliação do modelo.

Gradientes no PyTorch

Habilitando o Rastreamento de Gradientes

Construção de um Grafo Computacional

Cálculo de Gradientes