Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Inferenza Bayesiana e Processi di Markov | Fondamenti Teorici
Modelli Generativi Profondi con Python

Inferenza Bayesiana e Processi di Markov

Scorri per mostrare il menu

Comprendere l'inferenza bayesiana nell'IA

Che cos'è l'inferenza bayesiana?

L'inferenza bayesiana è un metodo statistico utilizzato per aggiornare le probabilità sulla base di nuove evidenze. I sistemi di intelligenza artificiale utilizzano l'inferenza bayesiana per perfezionare le loro previsioni man mano che raccolgono nuovi dati.

Immagina di dover prevedere il tempo. Se nella tua città di solito è soleggiato ma vedi formarsi nuvole scure, modifichi la tua aspettativa e prevedi pioggia. Questo è il funzionamento dell'inferenza bayesiana: si parte da una convinzione iniziale (prior), si incorporano nuovi dati e si aggiorna la convinzione di conseguenza.

P(HD)=P(DH)P(H)P(D)P(H|D)=\frac{P(D|H)\cdot P(H)}{P(D)}

dove:

  • P(HD)P(H|D) è la probabilità a posteriori, ovvero la probabilità aggiornata dell'ipotesi HH dato il dato DD;
  • P(DH)P(D|H) è la verosimiglianza, che rappresenta quanto bene l'ipotesi HH spiega il dato DD;
  • P(H)P(H) è la probabilità a priori, la convinzione iniziale prima di osservare DD;
  • P(D)P(D) è la verosimiglianza marginale, che funge da costante di normalizzazione.

Attività: Rilevamento dello spam

bayes_task

Descrizione del problema: Un filtro antispam AI utilizza la classificazione bayesiana.

  • Il 20% delle email sono spam (P(Spam) = 0.2);
  • L'80% delle email non sono spam (P(Not Spam) = 0.8);
  • Il 90% delle email di spam contiene la parola “urgent” (P(Urgent | Spam) = 0.9);
  • Il 10% delle email normali contiene la parola “urgent” (P(Urgent | Not Spam) = 0.1).

Domanda:
Se un'email contiene la parola "urgent", qual è la probabilità che sia spam (P(Spam | Urgent))?

Soluzione
expand arrow

Utilizzo del Teorema di Bayes P ( Spam | Urgent )

P ( Urgent | Spam ) ⋅ P ( Spam ) P ( Urgent )

Processi di Markov: Previsione del Futuro

Che cos'è una catena di Markov?

Una catena di Markov è un modello matematico in cui lo stato successivo dipende solo dallo stato attuale e non da quelli precedenti. È ampiamente utilizzata nell'IA per modellare dati sequenziali e processi decisionali. Ecco le formule chiave utilizzate nei processi di Markov:

1. Formula della probabilità di transizione
La probabilità che un sistema si trovi nello stato SjS_j al tempo tt dato il suo stato precedente SiS_i al tempo t1t-1:

P(SjSi)=TijP(S_j|S_i)=T_{ij}

dove TijT_{ij} è la probabilità di transizione dallo stato SiS_i allo stato SjS_j;

2. Aggiornamento della probabilità di stato
La distribuzione di probabilità sugli stati al tempo tt:

Pt=Pt1TP_t=P_{t-1}\cdot T

dove:

  • PtP_t è la probabilità di stato al tempo tt.
  • Pt1P_{t-1} è la probabilità di stato al tempo t1t-1.
  • TT è la matrice di transizione.

3. Probabilità stazionaria (Comportamento a lungo termine)
Per un processo di Markov che si protrae nel tempo, la probabilità stazionaria PsP_s soddisfa:

Ps=PsTP_s=P_s \cdot T

Questa equazione viene risolta per trovare la distribuzione di equilibrio in cui le probabilità non cambiano nel tempo.

Attività: Previsione del tempo

markov_task

Enunciato del problema: In una certa città, il tempo meteorologico passa tra giornate di Sole e giornate di Pioggia. La probabilità di transizione tra questi stati è data dalla seguente matrice di transizione:

T=[0.70.30.60.4]T = \begin{bmatrix} 0.7&0.3\\0.6&0.4 \end{bmatrix}

Dove:

  • 0.7 è la probabilità che dopo una giornata Sole segua ancora una giornata Sole;
  • 0.3 è la probabilità che una giornata Sole diventi Pioggia;
  • 0.6 è la probabilità che una giornata Pioggia diventi Sole;
  • 0.4 è la probabilità che dopo una giornata Pioggia segua ancora una giornata Pioggia.

Se oggi il tempo è Sole, qual è la probabilità che tra due giorni sia Pioggia?

Soluzione
expand arrow

Passo 1: Rappresentazione dello stato iniziale Poiché oggi è Sole, la nostra distribuzione di probabilità iniziale è: P 0

[ 1 0 ]

Processi Decisionali di Markov (MDP): Insegnare all'IA a Prendere Decisioni

Gli MDP estendono le catene di Markov introducendo azioni e ricompense, permettendo all'IA di prendere decisioni ottimali invece di limitarsi a prevedere gli stati.

Esempio: Un Robot in un Labirinto

Un robot che naviga in un labirinto apprende quali percorsi portano all'uscita considerando:

  • Azioni: muoversi a sinistra, destra, in alto o in basso;
  • Ricompense: raggiungere con successo l'obiettivo, colpire un muro o incontrare un ostacolo;
  • Strategia Ottimale: scegliere le azioni che massimizzano la ricompensa.

Gli MDP sono ampiamente utilizzati nell'IA per i giochi, nella robotica e nei sistemi di raccomandazione per ottimizzare il processo decisionale.

Modelli di Markov Nascosti (HMM): Comprendere Schemi Nascosti

Un HMM è un modello di Markov in cui alcuni stati sono nascosti e l'IA deve inferirli sulla base dei dati osservati.

Esempio: Riconoscimento Vocale

Quando parli a Siri o Alexa, l'IA non vede direttamente le parole. Invece, elabora le onde sonore e cerca di determinare la sequenza di parole più probabile.

Gli HMM sono fondamentali in:

  • Riconoscimento Vocale e Testuale: l'IA decifra il linguaggio parlato e la scrittura a mano;
  • Previsioni di Mercato Azionario: l'IA modella tendenze nascoste per prevedere le fluttuazioni del mercato;
  • Robotica e Gaming: agenti controllati dall'IA inferiscono stati nascosti da eventi osservabili.

Conclusione

L'inferenza bayesiana offre un metodo rigoroso per aggiornare le credenze nei modelli di IA, mentre i processi di Markov forniscono strumenti potenti per modellare dipendenze sequenziali. Questi principi sono alla base delle principali applicazioni di IA generativa, tra cui l'apprendimento per rinforzo, i modelli grafici probabilistici e la generazione strutturata di sequenze.

1. Qual è il ruolo principale dell'inferenza bayesiana nell'IA?

2. In un Processo Decisionale di Markov, cosa considera un'IA quando prende una decisione?

3. Quale delle seguenti è un'applicazione dei Modelli di Markov Nascosti?

question mark

Qual è il ruolo principale dell'inferenza bayesiana nell'IA?

Seleziona la risposta corretta

question mark

In un Processo Decisionale di Markov, cosa considera un'IA quando prende una decisione?

Seleziona la risposta corretta

question mark

Quale delle seguenti è un'applicazione dei Modelli di Markov Nascosti?

Seleziona la risposta corretta

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 2

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Sezione 2. Capitolo 2
some-alt