Swipe um das Menü anzuzeigen

Logistische Regression ist tatsächlich ein Klassifikationsalgorithmus, trotz des Wortes "Regression" im Namen.

Der Name stammt daher, dass sie auf der Linearen Regression basiert, jedoch eine logistische (Sigmoid-)Funktion verwendet, um die Ausgabe in Wahrscheinlichkeiten umzuwandeln. Dadurch kann sie Daten in Kategorien klassifizieren, anstatt kontinuierliche Werte vorherzusagen.

Angenommen, es soll vorhergesagt werden, ob eine Person bei einem ersten Kredit (keine Kreditgeschichte verfügbar) in Verzug gerät.

Bei der Linearen Regression wird eine Gleichung erstellt, um numerische Werte vorherzusagen. Dieselbe Gleichung kann verwendet werden, um einen "Zuverlässigkeitswert" zu berechnen. Dabei werden Merkmale wie Einkommen, Dauer der aktuellen Beschäftigung, Verhältnis von Schulden zu Einkommen usw. berücksichtigt. Ein höherer Zuverlässigkeitswert bedeutet eine geringere Ausfallwahrscheinlichkeit.

Die $\beta$ -Werte sind die Parameter, die das Modell erlernen muss. Während des Trainings passt der Computer diese Werte an, um bessere Vorhersagen zu treffen. Dies geschieht, indem er versucht, den Unterschied zwischen den vorhergesagten Ergebnissen und den tatsächlichen Labels zu minimieren – dieser Unterschied wird durch die sogenannte Verlustfunktion gemessen.

Um die Rohwerte des Modells in eine Klassenbezeichnung (0 oder 1) umzuwandeln, verwendet die logistische Regression eine Sigmoidfunktion. Diese Funktion nimmt eine beliebige reelle Zahl und presst sie in einen Bereich zwischen 0 und 1, sodass sie als Wahrscheinlichkeit interpretierbar ist.

Die Sigmoidfunktion ist definiert als:

\sigma(z) = \frac{1}{1 + e^{-z}}

Hierbei ist $z$ der Score (auch Logit genannt), den wir zuvor berechnet haben.

Gegeben zwei Klassen: 1 (eine Person wird bei einem ersten Kredit ausfallen) und 0 (eine Person wird bei einem ersten Kredit nicht ausfallen), erhalten wir nach Anwendung der Sigmoidfunktion die Wahrscheinlichkeit, dass die Instanz zur Klasse 1 gehört.

Um eine endgültige Entscheidung (0 oder 1) zu treffen, vergleichen wir die Wahrscheinlichkeit mit einem Schwellenwert – üblicherweise 0,5:

Ist die Wahrscheinlichkeit größer als 0,5, sagen wir 1 voraus;
Ist sie kleiner oder gleich 0,5, sagen wir 0 voraus.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Was ist Logistische Regression