Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Trovare i Parametri | Regressione Logistica
Classificazione con Python

Trovare i Parametri

Scorri per mostrare il menu

La regressione logistica richiede solo che il computer apprenda i parametri ottimali ββ. Per questo, è necessario definire cosa si intende per "parametri ottimali". Ricordiamo come funziona il modello: esso predice la probabilità pp di appartenenza alla classe 1:

p=σ(z)=σ(β0+β1x1+...)p = \sigma (z) = \sigma (\beta_0 + \beta_1x_1 + ...)

Dove

σ(z)=11+ez\sigma (z) = \frac{1}{1 + e^{-z}}

Ovviamente, un modello con parametri adeguati è quello che predice un valore pp alto (vicino a 1) per le istanze che appartengono effettivamente alla classe 1 e un valore pp basso (vicino a 0) per le istanze che appartengono effettivamente alla classe 0.

modello di regressione logistica buono e cattivo

Per valutare quanto il modello sia efficace o meno, si utilizza una funzione di costo. Nella regressione lineare, si utilizzava la MSE (errore quadratico medio) come funzione di costo. In questo caso, viene utilizzata una funzione diversa:

costo

Qui pp rappresenta la probabilità di appartenenza alla classe 1, come previsto dal modello, mentre yy indica il valore target reale.

Questa funzione non solo penalizza le previsioni errate, ma tiene anche conto della sicurezza del modello nelle sue previsioni. Come illustrato nell'immagine sopra, quando il valore di pp è vicino a yy (il target reale), la funzione di costo rimane relativamente bassa, indicando che il modello ha selezionato con sicurezza la classe corretta. Al contrario, se la previsione è errata, la funzione di costo aumenta esponenzialmente man mano che cresce la sicurezza del modello nella classe sbagliata.

good bad cost lr

Nel contesto della classificazione binaria con una funzione sigmoide, la funzione di costo utilizzata è specificamente chiamata perdita binaria di entropia incrociata (binary cross-entropy loss), come mostrato sopra. È importante notare che esiste anche una forma generale nota come perdita di entropia incrociata (cross-entropy loss, o entropia incrociata categoriale) utilizzata per problemi di classificazione multi-classe.

La perdita di entropia incrociata categoriale per una singola istanza di addestramento si calcola come segue:

Categorical Cross-Entropy Loss=i=1Cyilog(pi)\text{Categorical Cross-Entropy Loss} = -\sum_{i=1}^{C} y_i \log(p_i)

Dove

  • CC è il numero di classi;
  • yiy_i è il valore target effettivo (1 se la classe è quella corretta, 0 altrimenti);
  • pip_i è la probabilità prevista che l'istanza appartenga alla classe ii.

Si calcola la funzione di perdita per ogni istanza di addestramento e si prende la media. Questa media è chiamata funzione di costo. La regressione logistica trova i parametri β\beta che minimizzano la funzione di costo.

Sigmoid2
question mark

Quale di questi viene utilizzato come funzione di perdita nei compiti di classificazione?

Seleziona la risposta corretta

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 2

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Sezione 2. Capitolo 2
some-alt