Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Comprensione delle Distribuzioni di Probabilità | Probabilità e Statistica
Matematica per la Data Science

bookComprensione delle Distribuzioni di Probabilità

Distribuzioni di probabilità

Una distribuzione di probabilità indica quanto sono probabili i diversi risultati. Da un lato, per risultati discreti (come "quanti bastoncini difettosi"), si elencano le probabilità per ciascun conteggio possibile. Per misurazioni continue (come lunghezza o peso), invece, si descrive la densità su un intervallo. Formule generali per discreto vs continuo:

P(XA)=xAp(x)(discreto)P(aXb)=abf(x)dx(continuo)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreto}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continuo)

Esempio (verifica rapida): Se un processo garantisce che tutte le lunghezze tra 49.5 e 50.5 cm sono equiprobabili, la probabilità che un bastoncino ricada in un sottointervallo di 0.4 cm sarà la larghezza del sottointervallo divisa per 1.0 cm (questa è l'idea uniforme — sotto viene mostrata in dettaglio).

Distribuzione binomiale

La binomiale modella il numero di successi (ad esempio, bastoncini difettosi) in un numero fisso di prove indipendenti (ad esempio, 100 bastoncini), quando ogni prova ha la stessa probabilità di successo.

Formula:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Esempio:

In un lotto di n=100n=100 bastoncini dove ciascun bastoncino ha indipendentemente probabilità p=0.02p=0.02 di essere difettoso, qual è la probabilità di avere esattamente k=3k=3 bastoncini difettosi?

Passo 1 — calcolare la combinazione:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Passo 2 — calcolare le potenze:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Passo 3 — moltiplicare tutte le parti:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Significato: Circa 18,23% di probabilità di avere esattamente 3 bastoncini difettosi in un campione di 100. Se si osservano 3 difetti, è un risultato plausibile.

Note
Nota

Se la probabilità calcolata risulta maggiore di 1 o negativa, ricontrollare i calcoli delle combinazioni o delle potenze. Confrontare anche un valore pmf binomiale con la cdf se si desidera una risposta "al massimo" o "almeno".

Distribuzione uniforme

La distribuzione uniforme modella una misura continua in cui ogni valore all'interno di un intervallo [a,b] è equiprobabile (ad esempio, un intervallo di tolleranza per la lunghezza di una barra).

Formula:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilità tra due punti:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Esempio:

Parametri: a=49.5, b=50.5. Qual è la probabilità che la lunghezza di una barra X sia compresa tra 49.8 e 50.2? Calcolo dell'ampiezza dell'intervallo:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcolo del sotto-intervallo:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilità:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretazione: C'è una probabilità del 40% che una barra misurata casualmente rientri in questa tolleranza più stretta.

Note
Nota

Assicurarsi che a<ba<b e che il sotto-intervallo sia contenuto in [a,b][a,b]; altrimenti è necessario tagliare gli estremi e trattare gli intervalli esterni con probabilità 0.

Distribuzione normale

La distribuzione normale descrive misurazioni continue che si concentrano attorno a una media μμ con una dispersione misurata dalla deviazione standard σσ. Molti errori di misura e variazioni naturali seguono questa curva a campana.

Formula:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardizzazione tramite z-score:

z=xμσz = \frac{x-\mu}{\sigma}

La probabilità tra due valori si calcola tramite la funzione di distribuzione cumulativa (CDF) o la simmetria nei casi standard:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Qui Φ\Phi è la CDF normale standard.

Esempio A:

Parametri: μ=200μ=200, σ=5σ=5, trovare P(195X205)P(195≤X≤205).

Z-score:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Utilizzando la simmetria della distribuzione normale, la probabilità tra 1−1 e +1+1 deviazione standard è il noto:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretazione: Circa il 68,27% dei pesi delle barre ricade entro ±1 deviazione standard dalla media — la classica "regola del 68%".

Note
Nota

Quando i limiti sono simmetrici rispetto a utilizzare le regole empiriche note (689599.768–95–99.7). Per altri limiti, calcolare quindi utilizzare una tabella o una calcolatrice.

question mark

Z-score per X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 10

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Awesome!

Completion rate improved to 1.96

bookComprensione delle Distribuzioni di Probabilità

Scorri per mostrare il menu

Distribuzioni di probabilità

Una distribuzione di probabilità indica quanto sono probabili i diversi risultati. Da un lato, per risultati discreti (come "quanti bastoncini difettosi"), si elencano le probabilità per ciascun conteggio possibile. Per misurazioni continue (come lunghezza o peso), invece, si descrive la densità su un intervallo. Formule generali per discreto vs continuo:

P(XA)=xAp(x)(discreto)P(aXb)=abf(x)dx(continuo)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreto}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continuo)

Esempio (verifica rapida): Se un processo garantisce che tutte le lunghezze tra 49.5 e 50.5 cm sono equiprobabili, la probabilità che un bastoncino ricada in un sottointervallo di 0.4 cm sarà la larghezza del sottointervallo divisa per 1.0 cm (questa è l'idea uniforme — sotto viene mostrata in dettaglio).

Distribuzione binomiale

La binomiale modella il numero di successi (ad esempio, bastoncini difettosi) in un numero fisso di prove indipendenti (ad esempio, 100 bastoncini), quando ogni prova ha la stessa probabilità di successo.

Formula:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Esempio:

In un lotto di n=100n=100 bastoncini dove ciascun bastoncino ha indipendentemente probabilità p=0.02p=0.02 di essere difettoso, qual è la probabilità di avere esattamente k=3k=3 bastoncini difettosi?

Passo 1 — calcolare la combinazione:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Passo 2 — calcolare le potenze:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Passo 3 — moltiplicare tutte le parti:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Significato: Circa 18,23% di probabilità di avere esattamente 3 bastoncini difettosi in un campione di 100. Se si osservano 3 difetti, è un risultato plausibile.

Note
Nota

Se la probabilità calcolata risulta maggiore di 1 o negativa, ricontrollare i calcoli delle combinazioni o delle potenze. Confrontare anche un valore pmf binomiale con la cdf se si desidera una risposta "al massimo" o "almeno".

Distribuzione uniforme

La distribuzione uniforme modella una misura continua in cui ogni valore all'interno di un intervallo [a,b] è equiprobabile (ad esempio, un intervallo di tolleranza per la lunghezza di una barra).

Formula:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilità tra due punti:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Esempio:

Parametri: a=49.5, b=50.5. Qual è la probabilità che la lunghezza di una barra X sia compresa tra 49.8 e 50.2? Calcolo dell'ampiezza dell'intervallo:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcolo del sotto-intervallo:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilità:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretazione: C'è una probabilità del 40% che una barra misurata casualmente rientri in questa tolleranza più stretta.

Note
Nota

Assicurarsi che a<ba<b e che il sotto-intervallo sia contenuto in [a,b][a,b]; altrimenti è necessario tagliare gli estremi e trattare gli intervalli esterni con probabilità 0.

Distribuzione normale

La distribuzione normale descrive misurazioni continue che si concentrano attorno a una media μμ con una dispersione misurata dalla deviazione standard σσ. Molti errori di misura e variazioni naturali seguono questa curva a campana.

Formula:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardizzazione tramite z-score:

z=xμσz = \frac{x-\mu}{\sigma}

La probabilità tra due valori si calcola tramite la funzione di distribuzione cumulativa (CDF) o la simmetria nei casi standard:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Qui Φ\Phi è la CDF normale standard.

Esempio A:

Parametri: μ=200μ=200, σ=5σ=5, trovare P(195X205)P(195≤X≤205).

Z-score:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Utilizzando la simmetria della distribuzione normale, la probabilità tra 1−1 e +1+1 deviazione standard è il noto:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretazione: Circa il 68,27% dei pesi delle barre ricade entro ±1 deviazione standard dalla media — la classica "regola del 68%".

Note
Nota

Quando i limiti sono simmetrici rispetto a utilizzare le regole empiriche note (689599.768–95–99.7). Per altri limiti, calcolare quindi utilizzare una tabella o una calcolatrice.

question mark

Z-score per X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 5. Capitolo 10
some-alt