Was ist logistische Regression
Logistische Regression ist tatsächlich ein Klassifikationsalgorithmus, trotz des Wortes "Regression" im Namen.
Der Name stammt daher, dass sie auf der Linearen Regression basiert, jedoch eine logistische (Sigmoid-)Funktion verwendet, um die Ausgabe in Wahrscheinlichkeiten umzuwandeln. Dadurch kann sie Daten in Kategorien klassifizieren, anstatt kontinuierliche Werte vorherzusagen.
Angenommen, es soll vorhergesagt werden, ob eine Person bei einem ersten Kredit (keine Kreditgeschichte verfügbar) in Verzug gerät.
Bei der Linearen Regression wird eine Gleichung erstellt, um numerische Werte vorherzusagen. Dieselbe Gleichung kann verwendet werden, um einen "Zuverlässigkeitswert" zu berechnen. Dieser berücksichtigt Merkmale wie Einkommen, Dauer der aktuellen Beschäftigung, Verhältnis von Schulden zu Einkommen usw. Ein höherer Zuverlässigkeitswert bedeutet eine geringere Ausfallwahrscheinlichkeit.
Die β-Werte sind die Parameter, die das Modell erlernen muss. Während des Trainings passt der Computer diese Werte an, um bessere Vorhersagen zu ermöglichen. Dies geschieht, indem versucht wird, den Unterschied zwischen den vorhergesagten Ergebnissen und den tatsächlichen Labels zu minimieren – dieser Unterschied wird durch die sogenannte Loss-Funktion gemessen.
Um die Rohwerte des Modells in eine Klassenbezeichnung (0 oder 1) umzuwandeln, verwendet die logistische Regression eine Sigmoidfunktion. Diese Funktion nimmt eine beliebige reelle Zahl und drückt sie in einen Bereich zwischen 0 und 1, sodass sie als Wahrscheinlichkeit interpretierbar ist.
Die Sigmoidfunktion ist definiert als:
σ(z)=1+e−z1Hierbei ist z der Score (auch Logit genannt), den wir zuvor berechnet haben.
Gegeben zwei Klassen: 1 (eine Person wird bei einem ersten Kredit ausfallen) und 0 (eine Person wird bei einem ersten Kredit nicht ausfallen), erhalten wir nach Anwendung der Sigmoidfunktion die Wahrscheinlichkeit, dass die Instanz zur Klasse 1 gehört.
Um eine endgültige Entscheidung (0 oder 1) zu treffen, vergleichen wir die Wahrscheinlichkeit mit einem Schwellenwert – üblicherweise 0,5:
- Ist die Wahrscheinlichkeit größer als 0,5, sagen wir 1 voraus;
- Ist sie kleiner oder gleich 0,5, sagen wir 0 voraus.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4.17
Was ist logistische Regression
Swipe um das Menü anzuzeigen
Logistische Regression ist tatsächlich ein Klassifikationsalgorithmus, trotz des Wortes "Regression" im Namen.
Der Name stammt daher, dass sie auf der Linearen Regression basiert, jedoch eine logistische (Sigmoid-)Funktion verwendet, um die Ausgabe in Wahrscheinlichkeiten umzuwandeln. Dadurch kann sie Daten in Kategorien klassifizieren, anstatt kontinuierliche Werte vorherzusagen.
Angenommen, es soll vorhergesagt werden, ob eine Person bei einem ersten Kredit (keine Kreditgeschichte verfügbar) in Verzug gerät.
Bei der Linearen Regression wird eine Gleichung erstellt, um numerische Werte vorherzusagen. Dieselbe Gleichung kann verwendet werden, um einen "Zuverlässigkeitswert" zu berechnen. Dieser berücksichtigt Merkmale wie Einkommen, Dauer der aktuellen Beschäftigung, Verhältnis von Schulden zu Einkommen usw. Ein höherer Zuverlässigkeitswert bedeutet eine geringere Ausfallwahrscheinlichkeit.
Die β-Werte sind die Parameter, die das Modell erlernen muss. Während des Trainings passt der Computer diese Werte an, um bessere Vorhersagen zu ermöglichen. Dies geschieht, indem versucht wird, den Unterschied zwischen den vorhergesagten Ergebnissen und den tatsächlichen Labels zu minimieren – dieser Unterschied wird durch die sogenannte Loss-Funktion gemessen.
Um die Rohwerte des Modells in eine Klassenbezeichnung (0 oder 1) umzuwandeln, verwendet die logistische Regression eine Sigmoidfunktion. Diese Funktion nimmt eine beliebige reelle Zahl und drückt sie in einen Bereich zwischen 0 und 1, sodass sie als Wahrscheinlichkeit interpretierbar ist.
Die Sigmoidfunktion ist definiert als:
σ(z)=1+e−z1Hierbei ist z der Score (auch Logit genannt), den wir zuvor berechnet haben.
Gegeben zwei Klassen: 1 (eine Person wird bei einem ersten Kredit ausfallen) und 0 (eine Person wird bei einem ersten Kredit nicht ausfallen), erhalten wir nach Anwendung der Sigmoidfunktion die Wahrscheinlichkeit, dass die Instanz zur Klasse 1 gehört.
Um eine endgültige Entscheidung (0 oder 1) zu treffen, vergleichen wir die Wahrscheinlichkeit mit einem Schwellenwert – üblicherweise 0,5:
- Ist die Wahrscheinlichkeit größer als 0,5, sagen wir 1 voraus;
- Ist sie kleiner oder gleich 0,5, sagen wir 0 voraus.
Danke für Ihr Feedback!