Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Wahrscheinlichkeitsverteilungen und Zufälligkeit in der KI | Theoretische Grundlagen
Tiefe Generative Modelle mit Python

Wahrscheinlichkeitsverteilungen und Zufälligkeit in der KI

Swipe um das Menü anzuzeigen

Wahrscheinlichkeitsverteilungen und Zufälligkeit stehen im Zentrum generativer Modelle und ermöglichen es KI-Systemen, vielfältige und realistische Ausgaben zu erzeugen. Anstatt die Wahrscheinlichkeitstheorie explizit zu definieren, konzentriert sich dieses Kapitel darauf, wie Wahrscheinlichkeit in Generative AI genutzt wird, um Unsicherheiten zu modellieren, Daten zu sampeln und generative Modelle zu trainieren.

Rolle von Wahrscheinlichkeitsverteilungen in Generative AI

prob_dist

Generative Modelle basieren auf Wahrscheinlichkeitsverteilungen, um Datenmuster zu erlernen und neue Stichproben zu erzeugen. Die wichtigsten Konzepte sind:

  • Latentraum-Darstellung: Viele generative Modelle (z. B. VAEs, GANs) ordnen Eingabedaten einer Wahrscheinlichkeitsverteilung in niedrigerer Dimension zu. Das Ziehen von Stichproben aus dieser Verteilung erzeugt neue Datenpunkte;
  • Likelihood-Schätzung: Probabilistische Modelle schätzen die Wahrscheinlichkeit, einen Datenpunkt unter einer gelernten Verteilung zu beobachten, was das Training steuert;
  • Stichprobenziehung und Generierung: Der Prozess des Ziehens zufälliger Stichproben aus gelernten Verteilungen zur Erzeugung neuer synthetischer Daten.

Zentrale mathematische Konzepte:

Für eine Wahrscheinlichkeitsverteilung p(x)p(x) ist die Wahrscheinlichkeit der Daten XX gegeben Modellparametern θ\theta:

L(θX)=i=1Np(xiθ)\mathcal{L}(\theta|X)= \prod^{N}_{i=1}p(x_i|\theta)

Die Maximierung dieser Wahrscheinlichkeit hilft generativen Modellen, Muster aus Daten zu erlernen. In der generativen KI nehmen Modelle häufig bestimmte Formen von Wahrscheinlichkeitsverteilungen an—wie Gaußsche, Bernoulli- oder kategoriale Verteilungen—um Daten darzustellen. Die Wahl der Verteilung beeinflusst, wie Modelle lernen und neue Stichproben erzeugen. Beispielsweise werden bei der Textgenerierung kategoriale Verteilungen verwendet, um die Wahrscheinlichkeit jedes möglichen Wortes in Abhängigkeit von vorherigen Wörtern zu modellieren.

Zufälligkeit und Rauschen in generativen Modellen

Rauschen spielt eine entscheidende Rolle in der Generativen KI, sorgt für Vielfalt und verbessert die Robustheit:

  • Latentes Rauschen in GANs: In GANs wird ein Rauschvektor zp(x)z \sim p(x) (häufig aus einer Gaußschen oder Gleichverteilung gezogen) durch den Generator in realistische Beispiele umgewandelt. Diese Zufälligkeit gewährleistet Variation in den generierten Bildern;
  • Variationale Inferenz in VAEs: VAEs fügen im latenten Raum Gaußsches Rauschen hinzu, was eine sanfte Interpolation zwischen generierten Beispielen ermöglicht. Dadurch führen kleine Änderungen in den latenten Variablen zu sinnvollen Variationen in den Ausgaben;
  • Diffusionsmodelle und stochastische Prozesse: Diese Modelle lernen, einen schrittweisen Rauschprozess umzukehren, um hochwertige Daten zu erzeugen. Durch iteratives Verfeinern verrauschter Eingaben können sie komplexe, realistische Bilder generieren.

Beispiel: Gaußscher latenter Raum in VAEs

In VAEs gibt der Encoder Parameter für eine Gaußsche Verteilung aus:

q(zx)=N(z;μ(x),σ2(x))q(z|x)=\mathcal{N}(z;\mu(x),\sigma^2(x))

Anstelle einer deterministischen Abbildung sampeln VAEs aus dieser Verteilung und führen so kontrollierte Zufälligkeit ein, die eine vielfältige Generierung ermöglicht. Diese Technik erlaubt es VAEs, neue Gesichter zu erzeugen, indem zwischen verschiedenen latenten Raumrepräsentationen interpoliert wird.

Sampling-Methoden in der generativen KI

Sampling-Techniken sind essenziell, um neue Datenpunkte aus gelernten Verteilungen zu generieren:

  • Monte-Carlo-Sampling: Wird in probabilistischen Modellen wie der Bayesschen Inferenz verwendet, um Erwartungswerte zu approximieren. Die Monte-Carlo-Integration schätzt einen Erwartungswert wie folgt:
E[f(X)]1Ni=1Nf(Xi)\mathbb{E}[f(X)]\approx \frac{1}{N}\sum^N_{i=1}f(X_i)

wobei XiX_i aus der Zielverteilung gezogen werden.

  • Reparametrisierungstrick: In VAEs sorgt dieser Trick für den Gradientenfluss durch stochastische Knoten, indem zz wie folgt ausgedrückt wird:
z=μ+σε, εN(0,1)z=\mu + \sigma \cdot \varepsilon,\ \varepsilon \sim \mathcal{N}(0, 1)

Dieser Trick ermöglicht eine effiziente Rückpropagation durch stochastische Schichten.

  • Ancestrale Stichprobenziehung: In autoregressiven Modellen (z. B. GPT) werden Stichproben sequenziell auf Basis von bedingten Wahrscheinlichkeiten generiert. Beim Textgenerieren beispielsweise sagt das Modell das nächste Wort auf Grundlage der vorherigen voraus:
p(xtx1,x2,,xt1)p(x_t|x_1, x_2, \ldots,x_{t-1})

Dieser sequenzielle Prozess gewährleistet Kohärenz im generierten Text.

Beispiel: Ancestrale Stichprobenziehung bei der Textgenerierung

Angenommen, ein generatives Modell wird darauf trainiert, englische Sätze zu erzeugen. Bei der Eingabe "The cat" wählt das Modell das nächste Wort aus einer gelernten Wahrscheinlichkeitsverteilung und erzeugt Ausgaben wie:

  • "The cat sleeps."
  • "The cat jumps."
  • "The cat is hungry."

Jede Vorhersage des nächsten Wortes hängt von den zuvor generierten Wörtern ab und erzeugt sinnvolle Sequenzen.

Praktische Anwendungen in der Generativen KI

  • GANs: verwenden Rauschvektoren zur Erzeugung hochauflösender Bilder;
  • VAEs: kodieren Daten in eine Wahrscheinlichkeitsverteilung für eine gleichmäßige Interpolation im latenten Raum;
  • Diffusionsmodelle: nutzen stochastische Rauschunterdrückung zur schrittweisen Bildgenerierung;
  • Bayessche Generative Modelle: modellieren Unsicherheit bei generativen Aufgaben.

Fazit

Wahrscheinlichkeit und Zufälligkeit bilden die Grundlage der Generativen KI und ermöglichen es Modellen, Verteilungen zu erlernen, vielfältige Ausgaben zu erzeugen und reale Variabilität nachzubilden. Die nächsten Kapitel bauen auf diesen Konzepten auf und behandeln probabilistische Modellierung, neuronale Netze und generative Architekturen.

1. Welches der folgenden ist ein Beispiel für eine in der Generativen KI verwendete Wahrscheinlichkeitsverteilung?

2. Welche Rolle spielt Rauschen in Variational Autoencoders (VAEs)?

3. Welche Sampling-Methode wird häufig in generativen KI-Modellen wie GPT verwendet?

question mark

Welches der folgenden ist ein Beispiel für eine in der Generativen KI verwendete Wahrscheinlichkeitsverteilung?

Wählen Sie die richtige Antwort aus

question mark

Welche Rolle spielt Rauschen in Variational Autoencoders (VAEs)?

Wählen Sie die richtige Antwort aus

question mark

Welche Sampling-Methode wird häufig in generativen KI-Modellen wie GPT verwendet?

Wählen Sie die richtige Antwort aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 2. Kapitel 1
some-alt