Leer Het Vinden van de Parameters | Logistische Regressie

Logistische regressie vereist alleen dat de computer de beste parameters $β$ leert. Daarvoor moeten we definiëren wat "beste parameters" betekent. Laten we herinneren hoe het model werkt: het voorspelt de $p$ - kans om tot klasse 1 te behoren:

p = \sigma (z) = \sigma (\beta_0 + \beta_1x_1 + ...)

Waarbij

\sigma (z) = \frac{1}{1 + e^{-z}}

Het model met goede parameters voorspelt uiteraard een hoge (dicht bij 1) $p$ voor gevallen die daadwerkelijk tot klasse 1 behoren en een lage (dicht bij 0) $p$ voor gevallen met de werkelijke klasse 0.

Om te meten hoe slecht of goed het model is, gebruiken we een kostenfunctie. Bij lineaire regressie gebruikten we MSE (mean squared error) als kostenfunctie. Deze keer wordt een andere functie gebruikt:

Hier stelt $p$ de kans voor om tot klasse 1 te behoren, zoals voorspeld door het model, terwijl $y$ de werkelijke doelwaarde aanduidt.

Deze functie straft niet alleen onjuiste voorspellingen, maar houdt ook rekening met het vertrouwen van het model in zijn voorspellingen. Zoals geïllustreerd in de bovenstaande afbeelding, wanneer de waarde van $p$ dicht bij $y$ (de werkelijke doelwaarde) ligt, blijft de kostenfunctie relatief klein, wat aangeeft dat het model met vertrouwen de juiste klasse heeft gekozen. Omgekeerd, als de voorspelling onjuist is, neemt de kostenfunctie exponentieel toe naarmate het vertrouwen van het model in de onjuiste klasse toeneemt.

In de context van binaire classificatie met een sigmoidfunctie wordt de kostenfunctie die wordt gebruikt specifiek binaire cross-entropy loss genoemd, zoals hierboven getoond. Het is belangrijk op te merken dat er ook een algemene vorm bestaat, bekend als cross-entropy loss (of categorische cross-entropy), die wordt gebruikt voor multi-klasse classificatieproblemen.

De categorische cross-entropy loss voor een enkele trainingsinstantie wordt als volgt berekend:

\text{Categorical Cross-Entropy Loss} = -\sum_{i=1}^{C} y_i \log(p_i)

Waarbij

$C$ het aantal klassen is;
$y_i$ de werkelijke doelwaarde is (1 als de klasse de juiste klasse is, anders 0);
$p_i$ de voorspelde kans is dat de instantie tot klasse $i$ behoort.

We berekenen de verliesfunctie voor elke trainingsinstantie en nemen het gemiddelde. Dit gemiddelde wordt de kostenfunctie genoemd. Logistische regressie vindt de parameters $\beta$ die de kostenfunctie minimaliseren.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 2

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4.17

Veeg om het menu te tonen

p = \sigma (z) = \sigma (\beta_0 + \beta_1x_1 + ...)

Waarbij

\sigma (z) = \frac{1}{1 + e^{-z}}

Hier stelt $p$ de kans voor om tot klasse 1 te behoren, zoals voorspeld door het model, terwijl $y$ de werkelijke doelwaarde aanduidt.

De categorische cross-entropy loss voor een enkele trainingsinstantie wordt als volgt berekend:

\text{Categorical Cross-Entropy Loss} = -\sum_{i=1}^{C} y_i \log(p_i)

Waarbij

$C$ het aantal klassen is;
$y_i$ de werkelijke doelwaarde is (1 als de klasse de juiste klasse is, anders 0);
$p_i$ de voorspelde kans is dat de instantie tot klasse $i$ behoort.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 2