Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Einführungen in Ableitungen | Mathematische Analysis
Mathematik für Data Science

bookEinführungen in Ableitungen

Note
Definition

Eine Ableitung ist ein Maß dafür, wie sich eine Funktion verändert, wenn sich ihr Eingabewert ändert. Sie stellt die Änderungsrate der Funktion dar und ist grundlegend für die Analyse von Trends, die Optimierung von Prozessen und die Vorhersage von Verhalten in Bereichen wie Physik, Wirtschaft und maschinellem Lernen.

Die Grenzwertdefinition der Ableitung

Die Ableitung einer Funktion f(x)f(x) an einer bestimmten Stelle x=ax = a ist definiert durch:

limh0f(x+h)f(x)h\lim_{h \rarr 0} \frac{f(x + h) - f(x)}{h}

Diese Formel zeigt, wie stark sich f(x)f(x) verändert, wenn wir einen sehr kleinen Schritt hh entlang der x-Achse machen. Je kleiner hh wird, desto näher kommen wir an die momentane Änderungsrate.

Grundlegende Ableitungsregeln

Potenzregel

Ist eine Funktion eine Potenz von xx, gilt für die Ableitung:

ddxxn=nxn1\frac{d}{dx}x^n=nx^{n-1}

Das bedeutet, beim Ableiten wird der Exponent nach vorne gezogen und um eins verringert:

ddxx3=3x2\frac{d}{dx}x^3=3x^2

Konstante-Regel

Die Ableitung einer beliebigen Konstante ist null:

ddxC=0\frac{d}{dx}C=0

Beispielsweise gilt für f(x)=5f(x) = 5:

ddx5=0\frac{d}{dx}5=0

Summen- und Differenzenregel

Die Ableitung einer Summe oder Differenz von Funktionen ergibt sich wie folgt:

ddx[f(x)±g(x)]=f(x)±g(x)\frac{d}{dx} \left[ f(x) \pm g(x) \right] = f'(x) \pm g'(x)

Beispiel für die getrennte Ableitung:

ddx(x3+2x)=3x2+2\frac{d}{dx}(x^3 + 2x) = 3x^2 + 2

Produkt- und Quotientenregel

Produktregel

Werden zwei Funktionen multipliziert, ergibt sich die Ableitung wie folgt:

ddx[f(x)g(x)]=f(x)g(x)+f(x)g(x)\frac{d}{dx}[f(x)g(x)] = f'(x)g(x) + f(x)g'(x)

Das bedeutet, jede Funktion wird einzeln abgeleitet und anschließend werden die Produkte addiert. Für f(x)=x2f(x)=x^2 und g(x)=exg(x) = e^x gilt:

ddx[x2ex]=2xex+x3ex\frac{d}{dx}[x^2e^x] = 2xe^x + x^3e^x

Quotientenregel

Beim Dividieren von Funktionen gilt:

ddx[f(x)g(x)]=f(x)g(x)f(x)g(x)g(x)2\frac{d}{dx} \left[ \frac{f(x)}{g(x)} \right] = \frac{f'(x)g(x) - f(x)g'(x)}{g(x)^2}

Wenn f(x)=x2f(x)=x^2 und g(x)=x+1g(x)=x+1, dann:

ddx[x2x+1]=2x(x+1)x2(1)(x+1)2\frac{d}{dx} \left[ \frac{x^2}{x + 1} \right] = \frac{2x(x+1) - x^2(1)}{(x+1)^2}

Kettenregel: Ableitung von verketteten Funktionen

Beim Ableiten von verschachtelten Funktionen gilt:

ddxf(g(x))=f(g(x))g(x)\frac{d}{dx} f(g(x)) = f'(g(x)) \cdot g'(x)

Beispielsweise, wenn y=(3x+2)5y = (3x + 2)^5, dann:

ddx(3x+2)5=5(3x+2)43=15(3x+2)4\frac{d}{dx}(3x+2)^5 = 5(3x+2)^4 \cdot 3 = 15(3x+2)^4

Diese Regel ist wesentlich in neuronalen Netzen und Algorithmen des maschinellen Lernens.

Beispiel zur Kettenregel bei Exponentialfunktionen:

Beim Ableiten von Ausdrücken wie:

y=e2x2y =e^{2x^2}

liegt eine verkettete Funktion vor:

  • Äußere Funktion: eue^u
  • Innere Funktion: u=2x2u = 2x^2

Die Kettenregel schrittweise anwenden:

ddx2x2=4x\frac{d}{dx}2x^2=4x

Dann mit der ursprünglichen Exponentialfunktion multiplizieren:

ddx(e2x2)=4xe2x2\frac{d}{dx}\left( e^{2x^2} \right) = 4x \cdot e^{2x^2}
Note
Mehr erfahren

Im Bereich des maschinellen Lernens und neuronaler Netze tritt dies beim Arbeiten mit exponentiellen Aktivierungsfunktionen oder Verlustfunktionen auf.

Beispiel für die logarithmische Kettenregel:

Wir differenzieren ln(2x)\ln(2x). Auch hier handelt es sich um eine zusammengesetzte Funktion — Logarithmus außen, linear innen.

Differenzieren des inneren Teils:

ddx(2x)=2\frac{d}{dx}(2x)=2

Nun die Kettenregel auf den Logarithmus anwenden:

ddxln(2x)=12x2\frac{d}{dx}\ln(2x) = \frac{1}{2x} \cdot 2

Das vereinfacht sich zu:

ddxln(2x)=22x=1x\frac{d}{dx}\ln(2x) = \frac{2}{2x} = \frac{1}{x}
Note
Hinweis

Selbst wenn Sie ln(kx)\ln(kx) differenzieren, ist das Ergebnis immer 1x\frac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$x$}}, da sich die Konstanten herauskürzen.

Spezialfall: Ableitung der Sigmoidfunktion

Die Sigmoidfunktion wird häufig im maschinellen Lernen verwendet:

σ(x)=11+xx\sigma(x) = \frac{1}{1+x^{-x}}

Ihre Ableitung spielt eine Schlüsselrolle bei der Optimierung:

σ(x)=σ(x)(1σ(x))\sigma'(x) = \sigma(x)(1 - \sigma(x))

Wenn f(x)=11+exf(x) = \frac{\raisebox{1pt}{$1$}}{\raisebox{-3pt}{$1 + e^{-x}$}}, dann gilt:

f(x)=ex(1+ex)2f'(x) = \frac{e^{-x}}{(1 + e^{-x})^2}

Diese Formel stellt sicher, dass die Gradienten während des Trainings glatt bleiben.

question mark

Welche der folgenden Optionen stellt die Ableitung von x4x^4 korrekt dar?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 3

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain the limit definition of a derivative with a simple example?

How do the product, quotient, and chain rules differ in practice?

Can you show how to find the derivative of a more complex function using these rules?

Awesome!

Completion rate improved to 1.96

bookEinführungen in Ableitungen

Swipe um das Menü anzuzeigen

Note
Definition

Eine Ableitung ist ein Maß dafür, wie sich eine Funktion verändert, wenn sich ihr Eingabewert ändert. Sie stellt die Änderungsrate der Funktion dar und ist grundlegend für die Analyse von Trends, die Optimierung von Prozessen und die Vorhersage von Verhalten in Bereichen wie Physik, Wirtschaft und maschinellem Lernen.

Die Grenzwertdefinition der Ableitung

Die Ableitung einer Funktion f(x)f(x) an einer bestimmten Stelle x=ax = a ist definiert durch:

limh0f(x+h)f(x)h\lim_{h \rarr 0} \frac{f(x + h) - f(x)}{h}

Diese Formel zeigt, wie stark sich f(x)f(x) verändert, wenn wir einen sehr kleinen Schritt hh entlang der x-Achse machen. Je kleiner hh wird, desto näher kommen wir an die momentane Änderungsrate.

Grundlegende Ableitungsregeln

Potenzregel

Ist eine Funktion eine Potenz von xx, gilt für die Ableitung:

ddxxn=nxn1\frac{d}{dx}x^n=nx^{n-1}

Das bedeutet, beim Ableiten wird der Exponent nach vorne gezogen und um eins verringert:

ddxx3=3x2\frac{d}{dx}x^3=3x^2

Konstante-Regel

Die Ableitung einer beliebigen Konstante ist null:

ddxC=0\frac{d}{dx}C=0

Beispielsweise gilt für f(x)=5f(x) = 5:

ddx5=0\frac{d}{dx}5=0

Summen- und Differenzenregel

Die Ableitung einer Summe oder Differenz von Funktionen ergibt sich wie folgt:

ddx[f(x)±g(x)]=f(x)±g(x)\frac{d}{dx} \left[ f(x) \pm g(x) \right] = f'(x) \pm g'(x)

Beispiel für die getrennte Ableitung:

ddx(x3+2x)=3x2+2\frac{d}{dx}(x^3 + 2x) = 3x^2 + 2

Produkt- und Quotientenregel

Produktregel

Werden zwei Funktionen multipliziert, ergibt sich die Ableitung wie folgt:

ddx[f(x)g(x)]=f(x)g(x)+f(x)g(x)\frac{d}{dx}[f(x)g(x)] = f'(x)g(x) + f(x)g'(x)

Das bedeutet, jede Funktion wird einzeln abgeleitet und anschließend werden die Produkte addiert. Für f(x)=x2f(x)=x^2 und g(x)=exg(x) = e^x gilt:

ddx[x2ex]=2xex+x3ex\frac{d}{dx}[x^2e^x] = 2xe^x + x^3e^x

Quotientenregel

Beim Dividieren von Funktionen gilt:

ddx[f(x)g(x)]=f(x)g(x)f(x)g(x)g(x)2\frac{d}{dx} \left[ \frac{f(x)}{g(x)} \right] = \frac{f'(x)g(x) - f(x)g'(x)}{g(x)^2}

Wenn f(x)=x2f(x)=x^2 und g(x)=x+1g(x)=x+1, dann:

ddx[x2x+1]=2x(x+1)x2(1)(x+1)2\frac{d}{dx} \left[ \frac{x^2}{x + 1} \right] = \frac{2x(x+1) - x^2(1)}{(x+1)^2}

Kettenregel: Ableitung von verketteten Funktionen

Beim Ableiten von verschachtelten Funktionen gilt:

ddxf(g(x))=f(g(x))g(x)\frac{d}{dx} f(g(x)) = f'(g(x)) \cdot g'(x)

Beispielsweise, wenn y=(3x+2)5y = (3x + 2)^5, dann:

ddx(3x+2)5=5(3x+2)43=15(3x+2)4\frac{d}{dx}(3x+2)^5 = 5(3x+2)^4 \cdot 3 = 15(3x+2)^4

Diese Regel ist wesentlich in neuronalen Netzen und Algorithmen des maschinellen Lernens.

Beispiel zur Kettenregel bei Exponentialfunktionen:

Beim Ableiten von Ausdrücken wie:

y=e2x2y =e^{2x^2}

liegt eine verkettete Funktion vor:

  • Äußere Funktion: eue^u
  • Innere Funktion: u=2x2u = 2x^2

Die Kettenregel schrittweise anwenden:

ddx2x2=4x\frac{d}{dx}2x^2=4x

Dann mit der ursprünglichen Exponentialfunktion multiplizieren:

ddx(e2x2)=4xe2x2\frac{d}{dx}\left( e^{2x^2} \right) = 4x \cdot e^{2x^2}
Note
Mehr erfahren

Im Bereich des maschinellen Lernens und neuronaler Netze tritt dies beim Arbeiten mit exponentiellen Aktivierungsfunktionen oder Verlustfunktionen auf.

Beispiel für die logarithmische Kettenregel:

Wir differenzieren ln(2x)\ln(2x). Auch hier handelt es sich um eine zusammengesetzte Funktion — Logarithmus außen, linear innen.

Differenzieren des inneren Teils:

ddx(2x)=2\frac{d}{dx}(2x)=2

Nun die Kettenregel auf den Logarithmus anwenden:

ddxln(2x)=12x2\frac{d}{dx}\ln(2x) = \frac{1}{2x} \cdot 2

Das vereinfacht sich zu:

ddxln(2x)=22x=1x\frac{d}{dx}\ln(2x) = \frac{2}{2x} = \frac{1}{x}
Note
Hinweis

Selbst wenn Sie ln(kx)\ln(kx) differenzieren, ist das Ergebnis immer 1x\frac{\raisebox{1pt}{$1$}}{\raisebox{-1pt}{$x$}}, da sich die Konstanten herauskürzen.

Spezialfall: Ableitung der Sigmoidfunktion

Die Sigmoidfunktion wird häufig im maschinellen Lernen verwendet:

σ(x)=11+xx\sigma(x) = \frac{1}{1+x^{-x}}

Ihre Ableitung spielt eine Schlüsselrolle bei der Optimierung:

σ(x)=σ(x)(1σ(x))\sigma'(x) = \sigma(x)(1 - \sigma(x))

Wenn f(x)=11+exf(x) = \frac{\raisebox{1pt}{$1$}}{\raisebox{-3pt}{$1 + e^{-x}$}}, dann gilt:

f(x)=ex(1+ex)2f'(x) = \frac{e^{-x}}{(1 + e^{-x})^2}

Diese Formel stellt sicher, dass die Gradienten während des Trainings glatt bleiben.

question mark

Welche der folgenden Optionen stellt die Ableitung von x4x^4 korrekt dar?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 3
some-alt