Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Parametrien Löytäminen | Logistinen Regressio
Luokittelu Pythonilla

Parametrien Löytäminen

Pyyhkäise näyttääksesi valikon

Logistinen regressio vaatii tietokoneelta vain parhaiden parametrien ββ oppimista. Tätä varten on määriteltävä, mitä "parhaat parametrit" tarkoittavat. Palataanpa mallin toimintaan: se ennustaa pp - todennäköisyyden kuulua luokkaan 1:

p=σ(z)=σ(β0+β1x1+...)p = \sigma (z) = \sigma (\beta_0 + \beta_1x_1 + ...)

Missä

σ(z)=11+ez\sigma (z) = \frac{1}{1 + e^{-z}}

Ilmeisesti malli, jolla on hyvät parametrit, ennustaa korkean (lähellä 1) pp arvo niille havainnoille, jotka todella kuuluvat luokkaan 1, ja matalan (lähellä 0) pp arvo niille havainnoille, joiden todellinen luokka on 0.

hyvä huono logistinen regressiomalli

Mallin hyvyyden tai huonouden mittaamiseen käytetään kustannusfunktiota. Lineaarisessa regressiossa käytettiin MSE:tä (mean squared error) kustannusfunktiona. Tällä kertaa käytetään eri funktiota:

kustannus

Tässä pp edustaa mallin ennustamaa todennäköisyyttä kuulua luokkaan 1, kun taas yy tarkoittaa todellista tavoitearvoa.

Tämä funktio ei ainoastaan rankaise vääriä ennusteita, vaan ottaa huomioon myös mallin varmuuden ennusteissaan. Kuten yllä olevasta kuvasta nähdään, kun pp on lähellä yy:tä (todellinen tavoite), kustannusfunktio pysyy melko pienenä, mikä osoittaa, että malli valitsi oikean luokan luottavaisesti. Jos ennuste on väärä, kustannusfunktio kasvaa eksponentiaalisesti mallin varmuuden kasvaessa väärään luokkaan.

hyvä huono kustannus lr

Sigmoidifunktion binääriluokittelun yhteydessä käytetty kustannusfunktio tunnetaan nimellä binäärinen ristientropiahäviö (binary cross-entropy loss), kuten yllä on esitetty. On tärkeää huomata, että on olemassa myös yleisempi muoto nimeltä ristientropiahäviö (cross-entropy loss) eli kategorinen ristientropiahäviö, jota käytetään moniluokkaisissa luokitteluongelmissa.

Kategorinen ristientropiahäviö yksittäiselle opetusesimerkille lasketaan seuraavasti:

Categorical Cross-Entropy Loss=i=1Cyilog(pi)\text{Categorical Cross-Entropy Loss} = -\sum_{i=1}^{C} y_i \log(p_i)

Missä

  • CC on luokkien määrä;
  • yiy_i on todellinen tavoitearvo (1 jos luokka on oikea, muuten 0);
  • pip_i on ennustettu todennäköisyys, että havainto kuuluu luokkaan ii.

Häviöfunktio lasketaan jokaiselle opetusesimerkille ja otetaan näiden keskiarvo. Tätä keskiarvoa kutsutaan kustannusfunktioksi. Logistinen regressio etsii parametrit β\beta, jotka minimoivat kustannusfunktion.

Sigmoid2
question mark

Mitä seuraavista käytetään tappiona luokittelutehtävissä?

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 2. Luku 2
some-alt