Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Was ist logistische Regression | Logistische Regression
Klassifikation mit Python

bookWas ist logistische Regression

Logistische Regression ist tatsächlich ein Klassifikationsalgorithmus, trotz des Wortes "Regression" im Namen.

Der Name stammt daher, dass sie auf der Linearen Regression basiert, jedoch eine logistische (Sigmoid-)Funktion verwendet, um die Ausgabe in Wahrscheinlichkeiten umzuwandeln. Dadurch kann sie Daten in Kategorien klassifizieren, anstatt kontinuierliche Werte vorherzusagen.

Angenommen, es soll vorhergesagt werden, ob eine Person bei einem ersten Kredit (keine Kreditgeschichte verfügbar) in Verzug gerät.

Bei der Linearen Regression wird eine Gleichung erstellt, um numerische Werte vorherzusagen. Dieselbe Gleichung kann verwendet werden, um einen "Zuverlässigkeitswert" zu berechnen. Dieser berücksichtigt Merkmale wie Einkommen, Dauer der aktuellen Beschäftigung, Verhältnis von Schulden zu Einkommen usw. Ein höherer Zuverlässigkeitswert bedeutet eine geringere Ausfallwahrscheinlichkeit.

Die β\beta-Werte sind die Parameter, die das Modell erlernen muss. Während des Trainings passt der Computer diese Werte an, um bessere Vorhersagen zu ermöglichen. Dies geschieht, indem versucht wird, den Unterschied zwischen den vorhergesagten Ergebnissen und den tatsächlichen Labels zu minimieren – dieser Unterschied wird durch die sogenannte Loss-Funktion gemessen.

Um die Rohwerte des Modells in eine Klassenbezeichnung (0 oder 1) umzuwandeln, verwendet die logistische Regression eine Sigmoidfunktion. Diese Funktion nimmt eine beliebige reelle Zahl und drückt sie in einen Bereich zwischen 0 und 1, sodass sie als Wahrscheinlichkeit interpretierbar ist.

Die Sigmoidfunktion ist definiert als:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Hierbei ist zz der Score (auch Logit genannt), den wir zuvor berechnet haben.

Gegeben zwei Klassen: 1 (eine Person wird bei einem ersten Kredit ausfallen) und 0 (eine Person wird bei einem ersten Kredit nicht ausfallen), erhalten wir nach Anwendung der Sigmoidfunktion die Wahrscheinlichkeit, dass die Instanz zur Klasse 1 gehört.

Um eine endgültige Entscheidung (0 oder 1) zu treffen, vergleichen wir die Wahrscheinlichkeit mit einem Schwellenwert – üblicherweise 0,5:

  • Ist die Wahrscheinlichkeit größer als 0,5, sagen wir 1 voraus;
  • Ist sie kleiner oder gleich 0,5, sagen wir 0 voraus.
question mark

Wählen Sie alle korrekten Aussagen aus.

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 4.17

bookWas ist logistische Regression

Swipe um das Menü anzuzeigen

Logistische Regression ist tatsächlich ein Klassifikationsalgorithmus, trotz des Wortes "Regression" im Namen.

Der Name stammt daher, dass sie auf der Linearen Regression basiert, jedoch eine logistische (Sigmoid-)Funktion verwendet, um die Ausgabe in Wahrscheinlichkeiten umzuwandeln. Dadurch kann sie Daten in Kategorien klassifizieren, anstatt kontinuierliche Werte vorherzusagen.

Angenommen, es soll vorhergesagt werden, ob eine Person bei einem ersten Kredit (keine Kreditgeschichte verfügbar) in Verzug gerät.

Bei der Linearen Regression wird eine Gleichung erstellt, um numerische Werte vorherzusagen. Dieselbe Gleichung kann verwendet werden, um einen "Zuverlässigkeitswert" zu berechnen. Dieser berücksichtigt Merkmale wie Einkommen, Dauer der aktuellen Beschäftigung, Verhältnis von Schulden zu Einkommen usw. Ein höherer Zuverlässigkeitswert bedeutet eine geringere Ausfallwahrscheinlichkeit.

Die β\beta-Werte sind die Parameter, die das Modell erlernen muss. Während des Trainings passt der Computer diese Werte an, um bessere Vorhersagen zu ermöglichen. Dies geschieht, indem versucht wird, den Unterschied zwischen den vorhergesagten Ergebnissen und den tatsächlichen Labels zu minimieren – dieser Unterschied wird durch die sogenannte Loss-Funktion gemessen.

Um die Rohwerte des Modells in eine Klassenbezeichnung (0 oder 1) umzuwandeln, verwendet die logistische Regression eine Sigmoidfunktion. Diese Funktion nimmt eine beliebige reelle Zahl und drückt sie in einen Bereich zwischen 0 und 1, sodass sie als Wahrscheinlichkeit interpretierbar ist.

Die Sigmoidfunktion ist definiert als:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Hierbei ist zz der Score (auch Logit genannt), den wir zuvor berechnet haben.

Gegeben zwei Klassen: 1 (eine Person wird bei einem ersten Kredit ausfallen) und 0 (eine Person wird bei einem ersten Kredit nicht ausfallen), erhalten wir nach Anwendung der Sigmoidfunktion die Wahrscheinlichkeit, dass die Instanz zur Klasse 1 gehört.

Um eine endgültige Entscheidung (0 oder 1) zu treffen, vergleichen wir die Wahrscheinlichkeit mit einem Schwellenwert – üblicherweise 0,5:

  • Ist die Wahrscheinlichkeit größer als 0,5, sagen wir 1 voraus;
  • Ist sie kleiner oder gleich 0,5, sagen wir 0 voraus.
question mark

Wählen Sie alle korrekten Aussagen aus.

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 1
some-alt