Aprenda Descida do Gradiente | Análise Matemática

Definição

Descida do Gradiente é um algoritmo de otimização que minimiza uma função ajustando iterativamente seus parâmetros na direção da maior diminuição. É fundamental em aprendizado de máquina para permitir que modelos aprendam de forma eficiente a partir dos dados.

Compreendendo Gradientes

O gradiente de uma função representa a direção e inclinação da função em um determinado ponto. Ele indica para onde mover para minimizar a função.

Para uma função simples:

J(\theta) = \theta^2

A derivada (gradiente) é:

\nabla J(\theta) = \frac{d}{d \theta}\left(\theta^2\right)= 2\theta

Isso significa que, para qualquer valor de $θ$ , o gradiente indica como ajustar $θ$ para descer em direção ao mínimo.

Fórmula da Descida do Gradiente

A regra de atualização dos pesos é:

\theta \larr \theta - \alpha \nabla J(\theta)

Onde:

$\theta$ - parâmetro do modelo;
$\alpha$ - taxa de aprendizado (tamanho do passo);
$\nabla J(\theta)$ - gradiente da função que desejamos minimizar.

Para nossa função:

\theta_{\text{new}} = \theta_{\text{old}} - \alpha\left(2\theta_{old}\right)

Isso significa que atualizamos $θ$ iterativamente subtraindo o gradiente escalado.

Movimento Passo a Passo – Um Exemplo Visual

Exemplo com valores iniciais: $\theta = 3$ , $\alpha = 0.3$

$\theta_1 = 3 - 0.3(2 \times 3) = 3 - 1.8 = 1.2;$
$\theta_2 = 1.2 - 0.3(2 \times 1.2) = 1.2 - 0.72 = 0.48;$
$\theta_3 = 0.48 - 0.3(2\times0.48) = 0.48 - 0.288 = 0.192;$
$\theta_4 = 0.192 - 0.3(2 \times 0.192) = 0.192 - 0.115 = 0.077.$

Após algumas iterações, aproximação de $θ=0$ , o mínimo.

Taxa de Aprendizagem – Escolha Sábia de α

Muito grande $\ \alpha$ - ultrapassa, nunca converge;
Muito pequena $\ \alpha$ - converge muito lentamente;
Ótima $\ \alpha$ - equilíbrio entre velocidade e precisão.

Quando o Gradiente Descendente Para?

O gradiente descendente para quando:

\nabla J (\theta) \approx 0

Isso significa que as próximas atualizações são insignificantes e foi encontrado um mínimo.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 3. Capítulo 9

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain how to choose a good learning rate?

What happens if the gradient never reaches zero?

Can you show a real-world example where gradient descent is used?

Deslize para mostrar o menu