Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Bayessche Inferenz und Markow-Prozesse | Theoretische Grundlagen
Tiefe Generative Modelle mit Python

Bayessche Inferenz und Markow-Prozesse

Swipe um das Menü anzuzeigen

Verständnis der Bayesschen Inferenz in der KI

Was ist Bayessche Inferenz?

Bayessche Inferenz ist eine statistische Methode zur Aktualisierung von Wahrscheinlichkeiten auf Basis neuer Evidenz. KI-Systeme nutzen die Bayessche Inferenz, um ihre Vorhersagen zu verfeinern, während sie mehr Daten sammeln.

Stellen Sie sich vor, Sie sagen das Wetter voraus. In Ihrer Stadt ist es normalerweise sonnig, aber Sie sehen dunkle Wolken aufziehen, also passen Sie Ihre Erwartung an und prognostizieren Regen. So funktioniert die Bayessche Inferenz – sie beginnt mit einer anfänglichen Annahme (Prior), bezieht neue Daten ein und aktualisiert die Annahme entsprechend.

P(HD)=P(DH)P(H)P(D)P(H|D)=\frac{P(D|H)\cdot P(H)}{P(D)}

wobei:

  • P(HD)P(H|D) ist die posterior probability, die aktualisierte Wahrscheinlichkeit der Hypothese HH gegeben die Daten DD;
  • P(DH)P(D|H) ist die likelihood, die angibt, wie gut die Hypothese HH die Daten DD erklärt;
  • P(H)P(H) ist die prior probability, die anfängliche Annahme vor Beobachtung von DD;
  • P(D)P(D) ist die marginal likelihood, die als Normalisierungskonstante dient.

Aufgabe: Spam-Erkennung

bayes_task

Problemstellung: Ein KI-Spamfilter verwendet die Bayessche Klassifikation.

  • 20% der E-Mails sind Spam (P(Spam) = 0.2);
  • 80% der E-Mails sind kein Spam (P(Not Spam) = 0.8);
  • 90% der Spam-E-Mails enthalten das Wort „urgent“ (P(Urgent | Spam) = 0.9);
  • 10% der regulären E-Mails enthalten das Wort „urgent“ (P(Urgent | Not Spam) = 0.1).

Frage:
Wenn eine E-Mail das Wort "urgent" enthält, wie hoch ist die Wahrscheinlichkeit, dass es sich um Spam handelt (P(Spam | Urgent))?

Lösung
expand arrow

Verwendung des Satzes von Bayes P ( Spam | Urgent )

P ( Urgent | Spam ) ⋅ P ( Spam ) P ( Urgent )

Markow-Prozesse: Vorhersage der Zukunft

Was ist eine Markow-Kette?

Eine Markow-Kette ist ein mathematisches Modell, bei dem der nächste Zustand nur vom aktuellen Zustand abhängt und nicht von den vorherigen. Sie wird häufig in der KI verwendet, um sequenzielle Daten und Entscheidungsprozesse zu modellieren. Hier sind die wichtigsten Formeln, die in Markow-Prozessen verwendet werden:

1. Formel für Übergangswahrscheinlichkeit
Die Wahrscheinlichkeit, dass sich ein System zum Zeitpunkt tt im Zustand SjS_j befindet, gegeben den vorherigen Zustand SiS_i zum Zeitpunkt t1t-1:

P(SjSi)=TijP(S_j|S_i)=T_{ij}

wobei TijT_{ij} die Übergangswahrscheinlichkeit vom Zustand SiS_i zu SjS_j ist;

2. Aktualisierung der Zustandswahrscheinlichkeit
Die Wahrscheinlichkeitsverteilung über die Zustände zum Zeitpunkt tt:

Pt=Pt1TP_t=P_{t-1}\cdot T

wobei:

  • PtP_t die Zustandswahrscheinlichkeit zum Zeitpunkt tt ist.
  • Pt1P_{t-1} die Zustandswahrscheinlichkeit zum Zeitpunkt t1t-1 ist.
  • TT die Übergangsmatrix ist.

3. Stationäre Wahrscheinlichkeit (Langzeitverhalten)
Für einen lang laufenden Markov-Prozess erfüllt die stationäre Wahrscheinlichkeit PsP_s:

Ps=PsTP_s=P_s \cdot T

Diese Gleichung wird gelöst, um die Gleichgewichtsverteilung zu finden, bei der sich die Wahrscheinlichkeiten im Zeitverlauf nicht ändern.

Aufgabe: Wettervorhersage

markov_task

Problemstellung: In einer bestimmten Stadt wechselt das Wetter zwischen sonnigen und regnerischen Tagen. Die Übergangswahrscheinlichkeiten zwischen diesen Zuständen sind durch die folgende Übergangsmatrix gegeben:

T=[0.70.30.60.4]T = \begin{bmatrix} 0.7&0.3\\0.6&0.4 \end{bmatrix}

Dabei gilt:

  • 0,7 ist die Wahrscheinlichkeit, dass nach einem sonnigen Tag wieder ein sonniger Tag folgt;
  • 0,3 ist die Wahrscheinlichkeit, dass ein sonniger Tag in einen regnerischen Tag übergeht;
  • 0,6 ist die Wahrscheinlichkeit, dass ein regnerischer Tag in einen sonnigen Tag übergeht;
  • 0,4 ist die Wahrscheinlichkeit, dass nach einem regnerischen Tag wieder ein regnerischer Tag folgt.

Wenn das Wetter heute sonnig ist, wie groß ist die Wahrscheinlichkeit, dass es in zwei Tagen regnet?

Lösung
expand arrow

Schritt 1: Darstellung des Anfangszustands Da heute sonnig ist, ergibt sich die Anfangswahrscheinlichkeitsverteilung zu: P 0

[ 1 0 ]

Markow-Entscheidungsprozesse (MDPs): Entscheidungsfindung für KI

MDPs erweitern Markow-Ketten durch die Einführung von Aktionen und Belohnungen, sodass KI optimale Entscheidungen treffen kann, anstatt nur Zustände vorherzusagen.

Beispiel: Ein Roboter im Labyrinth

Ein Roboter, der ein Labyrinth durchquert, lernt, welche Wege zum Ausgang führen, indem er Folgendes berücksichtigt:

  • Aktionen: nach links, rechts, oben oder unten bewegen;
  • Belohnungen: erfolgreiches Erreichen des Ziels, gegen eine Wand stoßen oder auf ein Hindernis treffen;
  • Optimale Strategie: Auswahl von Aktionen, die die Belohnung maximieren.

MDPs werden häufig in Spiel-KI, Robotik und Empfehlungssystemen eingesetzt, um die Entscheidungsfindung zu optimieren.

Versteckte Markow-Modelle (HMMs): Erkennung verborgener Muster

Ein HMM ist ein Markow-Modell, bei dem einige Zustände verborgen sind und die KI diese anhand beobachteter Daten erschließen muss.

Beispiel: Spracherkennung

Wenn Sie mit Siri oder Alexa sprechen, sieht die KI die Wörter nicht direkt. Stattdessen verarbeitet sie Schallwellen und versucht, die wahrscheinlichste Wortfolge zu bestimmen.

HMMs sind unverzichtbar für:

  • Sprach- und Texterkennung: KI entschlüsselt gesprochene Sprache und Handschrift;
  • Börsenprognosen: KI modelliert verborgene Trends, um Marktschwankungen vorherzusagen;
  • Robotik und Spiele: Von KI gesteuerte Agenten erschließen verborgene Zustände aus beobachtbaren Ereignissen.

Fazit

Bayessche Inferenz bietet eine fundierte Methode zur Aktualisierung von Überzeugungen in KI-Modellen, während Markow-Prozesse leistungsstarke Werkzeuge zur Modellierung sequentieller Abhängigkeiten bereitstellen. Diese Prinzipien bilden die Grundlage für zentrale generative KI-Anwendungen, darunter Reinforcement Learning, probabilistische grafische Modelle und strukturierte Sequenzgenerierung.

1. Was ist die Hauptaufgabe der Bayesschen Inferenz in der KI?

2. Was berücksichtigt eine KI bei der Entscheidungsfindung in einem Markow-Entscheidungsprozess?

3. Welche der folgenden Anwendungen ist ein Einsatzgebiet von versteckten Markow-Modellen?

question mark

Was ist die Hauptaufgabe der Bayesschen Inferenz in der KI?

Wählen Sie die richtige Antwort aus

question mark

Was berücksichtigt eine KI bei der Entscheidungsfindung in einem Markow-Entscheidungsprozess?

Wählen Sie die richtige Antwort aus

question mark

Welche der folgenden Anwendungen ist ein Einsatzgebiet von versteckten Markow-Modellen?

Wählen Sie die richtige Antwort aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 2

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 2. Kapitel 2
some-alt