Lära Gradientnedstigning | Matematisk Analys

Definition

Gradient Descent är en optimeringsalgoritm som minimerar en funktion genom att iterativt justera dess parametrar i riktning mot den brantaste minskningen. Den är grundläggande inom maskininlärning för att möjliggöra effektiv inlärning från data.

Förståelse av gradienter

Gradienten av en funktion representerar riktningen och lutningen av funktionen vid en given punkt. Den visar åt vilket håll man ska röra sig för att minimera funktionen.

För en enkel funktion:

J(\theta) = \theta^2

Derivatan (gradienten) är:

\nabla J(\theta) = \frac{d}{d \theta}\left(\theta^2\right)= 2\theta

Detta innebär att för varje värde på $θ$ , visar gradienten hur vi ska justera $θ$ för att närma oss minimum.

Gradient Descent-formel

Regeln för viktuppdatering är:

\theta \larr \theta - \alpha \nabla J(\theta)

Där:

$\theta$ – modellparameter;
$\alpha$ – inlärningshastighet (stegstorlek);
$\nabla J(\theta)$ – gradienten av funktionen vi vill minimera.

För vår funktion:

\theta_{\text{new}} = \theta_{\text{old}} - \alpha\left(2\theta_{old}\right)

Detta innebär att vi uppdaterar $θ$ iterativt genom att subtrahera den skalade gradienten.

Stegvis förflyttning – En visuell

Exempel med startvärden: $\theta = 3$ , $\alpha = 0.3$

$\theta_1 = 3 - 0.3(2 \times 3) = 3 - 1.8 = 1.2;$
$\theta_2 = 1.2 - 0.3(2 \times 1.2) = 1.2 - 0.72 = 0.48;$
$\theta_3 = 0.48 - 0.3(2\times0.48) = 0.48 - 0.288 = 0.192;$
$\theta_4 = 0.192 - 0.3(2 \times 0.192) = 0.192 - 0.115 = 0.077.$

Efter några iterationer närmar vi oss $θ=0$ , minimum.

Inlärningshastighet – Välj α med omsorg

För stort $\ \alpha$ – överskjuter, konvergerar aldrig;
För litet $\ \alpha$ – konvergerar för långsamt;
Optimalt $\ \alpha$ – balanserar hastighet och noggrannhet.

När slutar gradientnedstigning?

Gradientnedstigning slutar när:

\nabla J (\theta) \approx 0

Detta innebär att ytterligare uppdateringar är obetydliga och att vi har hittat ett minimum.

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 9

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Svep för att visa menyn