Lernen Gradientenabstieg | Mathematische Analysis

Definition

Gradient Descent ist ein Optimierungsalgorithmus, der eine Funktion minimiert, indem er ihre Parameter schrittweise in Richtung des steilsten Abstiegs anpasst. Er ist grundlegend im maschinellen Lernen, da er es Modellen ermöglicht, effizient aus Daten zu lernen.

Verständnis von Gradienten

Der Gradient einer Funktion stellt die Richtung und Steilheit der Funktion an einem bestimmten Punkt dar. Er zeigt an, in welche Richtung man sich bewegen muss, um die Funktion zu minimieren.

Für eine einfache Funktion:

J(\theta) = \theta^2

Die Ableitung (Gradient) ist:

\nabla J(\theta) = \frac{d}{d \theta}\left(\theta^2\right)= 2\theta

Das bedeutet, dass für jeden Wert von $θ$ der Gradient angibt, wie $θ$ angepasst werden muss, um zum Minimum abzusteigen.

Formel für Gradient Descent

Die Regel zur Aktualisierung der Gewichte lautet:

\theta \larr \theta - \alpha \nabla J(\theta)

Dabei gilt:

$\theta$ – Modellparameter;
$\alpha$ – Lernrate (Schrittweite);
$\nabla J(\theta)$ – Gradient der zu minimierenden Funktion.

Für unsere Funktion:

\theta_{\text{new}} = \theta_{\text{old}} - \alpha\left(2\theta_{old}\right)

Das bedeutet, dass $θ$ iterativ aktualisiert wird, indem der skalierte Gradient subtrahiert wird.

Schrittweises Vorgehen – Eine Visualisierung

Beispiel mit Startwerten: $\theta = 3$ , $\alpha = 0{,}3$

$\theta_1 = 3 - 0{,}3(2 \times 3) = 3 - 1{,}8 = 1{,}2;$
$\theta_2 = 1{,}2 - 0{,}3(2 \times 1{,}2) = 1{,}2 - 0{,}72 = 0{,}48;$
$\theta_3 = 0{,}48 - 0{,}3(2\times0{,}48) = 0{,}48 - 0{,}288 = 0{,}192;$
$\theta_4 = 0{,}192 - 0{,}3(2 \times 0{,}192) = 0{,}192 - 0{,}115 = 0{,}077.$

Nach einigen Iterationen bewegen wir uns auf $θ=0$ zu, das Minimum.

Lernrate – Die kluge Wahl von α

Zu groß $\ \alpha$ – Überschreitung, keine Konvergenz;
Zu klein $\ \alpha$ – zu langsame Konvergenz;
Optimal $\ \alpha$ – Ausgewogenheit zwischen Geschwindigkeit und Genauigkeit.

Wann stoppt der Gradientenabstieg?

Der Gradientenabstieg stoppt, wenn:

\nabla J (\theta) \approx 0

Dies bedeutet, dass weitere Aktualisierungen unbedeutend sind und ein Minimum gefunden wurde.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 9

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Swipe um das Menü anzuzeigen