Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Bestimmung der Parameter | Logistische Regression
Klassifikation mit Python

Bestimmung der Parameter

Swipe um das Menü anzuzeigen

Die logistische Regression erfordert vom Computer lediglich das Erlernen der optimalen Parameter ββ. Dazu muss definiert werden, was unter „optimalen Parametern“ zu verstehen ist. Erinnern wir uns an die Funktionsweise des Modells: Es sagt die Wahrscheinlichkeit pp für die Zugehörigkeit zur Klasse 1 voraus:

p=σ(z)=σ(β0+β1x1+...)p = \sigma (z) = \sigma (\beta_0 + \beta_1x_1 + ...)

Dabei gilt:

σ(z)=11+ez\sigma (z) = \frac{1}{1 + e^{-z}}

Ein Modell mit guten Parametern sagt für Instanzen, die tatsächlich zur Klasse 1 gehören, ein hohes (nahe 1) pp voraus und für Instanzen mit der tatsächlichen Klasse 0 ein niedriges (nahe 0) pp.

gutes schlechtes logistische Regression Modell

Zur Bewertung, wie schlecht oder gut das Modell ist, wird eine Kostenfunktion verwendet. In der linearen Regression wurde MSE (mittlerer quadratischer Fehler) als Kostenfunktion genutzt. Diesmal wird eine andere Funktion verwendet:

Kosten

Hier steht pp für die vom Modell vorhergesagte Wahrscheinlichkeit, zur Klasse 1 zu gehören, während yy den tatsächlichen Zielwert bezeichnet.

Diese Funktion bestraft nicht nur falsche Vorhersagen, sondern berücksichtigt auch die Sicherheit des Modells bei seinen Vorhersagen. Wie in der obigen Abbildung gezeigt, bleibt die Kostenfunktion relativ klein, wenn der Wert von pp nahe bei yy (dem tatsächlichen Ziel) liegt, was darauf hinweist, dass das Modell die richtige Klasse mit hoher Sicherheit ausgewählt hat. Ist die Vorhersage hingegen falsch, steigt die Kostenfunktion exponentiell an, je sicherer sich das Modell bei der falschen Klasse ist.

good bad cost lr

Im Kontext der binären Klassifikation mit einer Sigmoid-Funktion wird die verwendete Kostenfunktion speziell als binärer Kreuzentropie-Verlust bezeichnet, wie oben gezeigt. Es ist wichtig zu beachten, dass es auch eine allgemeine Form gibt, die als Kreuzentropie-Verlust (oder kategorischer Kreuzentropie-Verlust) bekannt ist und für Mehrklassen-Klassifikationsprobleme verwendet wird.

Der kategorische Kreuzentropie-Verlust für eine einzelne Trainingsinstanz wird wie folgt berechnet:

Categorical Cross-Entropy Loss=i=1Cyilog(pi)\text{Categorical Cross-Entropy Loss} = -\sum_{i=1}^{C} y_i \log(p_i)

Dabei gilt:

  • CC ist die Anzahl der Klassen;
  • yiy_i ist der tatsächliche Zielwert (1, wenn die Klasse die korrekte Klasse ist, sonst 0);
  • pip_i ist die vorhergesagte Wahrscheinlichkeit, dass die Instanz zur Klasse ii gehört.

Die Verlustfunktion wird für jede Trainingsinstanz berechnet und der Durchschnitt genommen. Dieser Durchschnitt wird als Kostenfunktion bezeichnet. Die logistische Regression findet die Parameter β\beta, die die Kostenfunktion minimieren.

Sigmoid2
question mark

Welche dieser Optionen wird als Verlustfunktion bei Klassifikationsaufgaben verwendet?

Wählen Sie die richtige Antwort aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 2

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 2. Kapitel 2
some-alt