Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Wat Is Logistische Regressie | Logistische Regressie
Classificatie met Python

bookWat Is Logistische Regressie

Logistische regressie is eigenlijk een classificatie-algoritme, ondanks het woord "Regressie" in de naam.

De naam is afkomstig van het feit dat het gebaseerd is op lineaire regressie, maar het gebruikt een logistische (sigmoïde) functie om de uitvoer om te zetten in kansen, waardoor het data kan classificeren in categorieën in plaats van continue waarden te voorspellen.

Stel dat u wilt voorspellen of een persoon in gebreke zal blijven bij een eerste lening (geen kredietgeschiedenis beschikbaar).

Bij lineaire regressie bouwen we een vergelijking om numerieke waarden te voorspellen. We kunnen dezelfde vergelijking gebruiken om een "betrouwbaarheidsscore" te berekenen. Deze houdt rekening met kenmerken zoals inkomen, duur van het huidige dienstverband, schuld-inkomenverhouding, enzovoort. Een hogere betrouwbaarheidsscore betekent een lagere kans op wanbetaling.

De β\beta-waarden zijn de parameters die het model moet leren. Tijdens de training past de computer deze waarden aan om betere voorspellingen te doen. Dit gebeurt door te proberen het verschil te minimaliseren tussen de voorspelde resultaten en de werkelijke labels - dit verschil wordt gemeten met iets dat de verliesfunctie wordt genoemd.

Om de ruwe output van het model om te zetten naar een klassenlabel (0 of 1), gebruikt Logistische Regressie een sigmoidfunctie. Deze functie neemt elk reëel getal en perst het in een bereik tussen 0 en 1, waardoor het geïnterpreteerd kan worden als een waarschijnlijkheid.

De sigmoidfunctie is gedefinieerd als:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Hierbij is zz de score (ook wel de logit genoemd) die we eerder hebben berekend.

Gegeven twee klassen: 1 (een persoon zal in gebreke blijven bij een eerste lening) en 0 (een persoon zal niet in gebreke blijven bij een eerste lening), krijgen we na het toepassen van de sigmoid de waarschijnlijkheid dat het voorbeeld tot klasse 1 behoort.

Om een definitieve beslissing te nemen (0 of 1), vergelijken we de waarschijnlijkheid met een drempelwaarde - meestal 0,5:

  • Als de waarschijnlijkheid groter is dan 0,5, voorspellen we 1;
  • Als deze kleiner dan of gelijk aan 0,5 is, voorspellen we 0.
question mark

Selecteer alle juiste uitspraken.

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 1

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4.17

bookWat Is Logistische Regressie

Veeg om het menu te tonen

Logistische regressie is eigenlijk een classificatie-algoritme, ondanks het woord "Regressie" in de naam.

De naam is afkomstig van het feit dat het gebaseerd is op lineaire regressie, maar het gebruikt een logistische (sigmoïde) functie om de uitvoer om te zetten in kansen, waardoor het data kan classificeren in categorieën in plaats van continue waarden te voorspellen.

Stel dat u wilt voorspellen of een persoon in gebreke zal blijven bij een eerste lening (geen kredietgeschiedenis beschikbaar).

Bij lineaire regressie bouwen we een vergelijking om numerieke waarden te voorspellen. We kunnen dezelfde vergelijking gebruiken om een "betrouwbaarheidsscore" te berekenen. Deze houdt rekening met kenmerken zoals inkomen, duur van het huidige dienstverband, schuld-inkomenverhouding, enzovoort. Een hogere betrouwbaarheidsscore betekent een lagere kans op wanbetaling.

De β\beta-waarden zijn de parameters die het model moet leren. Tijdens de training past de computer deze waarden aan om betere voorspellingen te doen. Dit gebeurt door te proberen het verschil te minimaliseren tussen de voorspelde resultaten en de werkelijke labels - dit verschil wordt gemeten met iets dat de verliesfunctie wordt genoemd.

Om de ruwe output van het model om te zetten naar een klassenlabel (0 of 1), gebruikt Logistische Regressie een sigmoidfunctie. Deze functie neemt elk reëel getal en perst het in een bereik tussen 0 en 1, waardoor het geïnterpreteerd kan worden als een waarschijnlijkheid.

De sigmoidfunctie is gedefinieerd als:

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Hierbij is zz de score (ook wel de logit genoemd) die we eerder hebben berekend.

Gegeven twee klassen: 1 (een persoon zal in gebreke blijven bij een eerste lening) en 0 (een persoon zal niet in gebreke blijven bij een eerste lening), krijgen we na het toepassen van de sigmoid de waarschijnlijkheid dat het voorbeeld tot klasse 1 behoort.

Om een definitieve beslissing te nemen (0 of 1), vergelijken we de waarschijnlijkheid met een drempelwaarde - meestal 0,5:

  • Als de waarschijnlijkheid groter is dan 0,5, voorspellen we 1;
  • Als deze kleiner dan of gelijk aan 0,5 is, voorspellen we 0.
question mark

Selecteer alle juiste uitspraken.

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 1
some-alt