Summary  
This chapter introduces how to enable gradient tracking on tensors, build a dynamic computational graph, and compute gradients via backpropagation in PyTorch’s autograd system.

General domain of usage  
Training neural networks

Pour récapituler, les **gradients** sont les dérivées partielles d'une fonction par rapport à ses entrées.

Définition

Les gradients sont essentiels dans les **tâches d'optimisation** telles que l'entraînement des réseaux de neurones, où ils permettent d'ajuster les poids et les biais afin de minimiser l'erreur. Dans **PyTorch**, ils sont calculés automatiquement à l'aide du module `autograd`, qui suit les opérations sur les tenseurs et calcule efficacement les dérivées.



## Activation du suivi des gradients
Pour activer le suivi des gradients pour un tenseur, l'argument `requires_grad=True` est utilisé lors de la création du tenseur. Cela indique à PyTorch de **suivre toutes les opérations sur le tenseur** pour le calcul des gradients.

import torch
# Create a tensor with gradient tracking enabled
tensor = torch.tensor(2.0, requires_grad=True)
print(tensor)

## Construction d'un graphe computationnel

PyTorch construit un **graphe computationnel dynamique** lors de l'exécution d'opérations sur des tenseurs avec `requires_grad=True`. Ce graphe conserve les relations entre les tenseurs et les opérations, permettant ainsi la **différentiation automatique**.

Nous allons commencer par définir une fonction polynomiale relativement simple :

<p>
  <b style="font-weight: bold">y</b> = 5x<super style="vertical-align: super; font-size: smaller">3</super> + 2x<super style="vertical-align: super; font-size: smaller">2</super> + 4x + 8
</p>



L'objectif est de calculer la dérivée par rapport à `x` en `x = 2`.

import torch
# Define the tensor
x = torch.tensor(2.0, requires_grad=True)
# Define the function
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
print(f"Function output: {y}")

La visualisation de ce **graphe computationnel** créée à l'aide de la bibliothèque **PyTorchViz** peut sembler quelque peu complexe, mais elle transmet efficacement l'idée principale qui la sous-tend :

## Calcul des gradients

Pour calculer le gradient, la méthode `backward()` doit être appelée sur le **tenseur de sortie**. Cela permet de calculer la dérivée de la fonction par rapport au **tenseur d'entrée**.

Le gradient calculé peut ensuite être consulté via l'attribut `.grad`.



import torch
x = torch.tensor(2.0, requires_grad=True)
y = 5 * x ** 3 + 2 * x ** 2 + 4 * x + 8
# Perform backpropagation
y.backward()
# Print the gradient of x
grad = x.grad
print(f"Gradient of x: {grad}")

Le gradient calculé est la dérivée de `y` par rapport à `x`, évaluée en `x = 2`.

Comment accéder au gradient calculé d'un tenseur après la rétropropagation dans PyTorch ?

Passez des bibliothèques de haut niveau à la flexibilité de PyTorch. Maîtrisez les éléments fondamentaux de l'apprentissage profond en travaillant avec les tenseurs, la structure de données centrale de PyTorch. Explorez la différenciation automatique avec les gradients, implémentez la rétropropagation et construisez des réseaux de neurones complets à partir de zéro. Apprenez à manipuler des ensembles de données réels et à gérer l'ensemble du cycle d'entraînement – de l'initialisation des poids à l'évaluation du modèle.

Gradients dans PyTorch

Activation du suivi des gradients

Construction d'un graphe computationnel

Calcul des gradients