Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Compreendendo Distribuições de Probabilidade | Probabilidade e Estatística
Matemática para Ciência de Dados

bookCompreendendo Distribuições de Probabilidade

Distribuições de probabilidade

Uma distribuição de probabilidade indica a probabilidade de diferentes resultados. Para resultados discretos (como "quantos bastões defeituosos"), listam-se as probabilidades para cada contagem possível. Para medições contínuas (como comprimento ou peso), descreve-se a densidade ao longo de um intervalo. Fórmulas gerais para casos discretos e contínuos:

P(XA)=xAp(x)(discreto)P(aXb)=abf(x)dx(contıˊnuo)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreto}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (contínuo)

Exemplo (verificação rápida): Se um processo garante que todos os comprimentos entre 49,5 e 50,5 cm são igualmente prováveis, a probabilidade de um bastão estar em um subintervalo de 0,4 cm será a largura do subintervalo dividida por 1,0 cm (essa é a ideia da distribuição uniforme — abaixo mostramos em detalhe).

Distribuição binomial

A binomial modela o número de sucessos (por exemplo, bastões defeituosos) em um número fixo de tentativas independentes (por exemplo, 100 bastões), quando cada tentativa tem a mesma probabilidade de sucesso.

Fórmula:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Exemplo:

Em um lote de n=100n=100 bastões onde cada bastão tem independentemente probabilidade p=0.02p=0.02 de ser defeituoso, qual a probabilidade de exatamente k=3k=3 bastões defeituosos?

Passo 1 — calcular a combinação:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Passo 2 — calcular as potências:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Passo 3 — multiplicar todas as partes:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Significado: Aproximadamente 18,23% de chance de exatamente 3 bastões defeituosos em uma amostra de 100 bastões. Se forem observados 3 defeitos, esse é um resultado plausível.

Note
Nota

Se a probabilidade calculada parecer maior que 1 ou negativa, verifique novamente o cálculo da combinação ou das potências. Também compare um valor da pmf binomial com a cdf se desejar respostas do tipo "no máximo" ou "pelo menos".

Distribuição uniforme

A distribuição uniforme modela uma medição contínua onde todo valor dentro de um intervalo [a,b] é igualmente provável (por exemplo, um intervalo de tolerância para o comprimento de uma haste).

Fórmula:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilidade entre dois pontos:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Exemplo:

Parâmetros: a=49.5, b=50.5. Qual a probabilidade de o comprimento de uma haste X estar entre 49.8 e 50.2? Calcule a largura do intervalo:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcule o subintervalo:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilidade:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretação: Há uma chance de 40% de uma haste medida aleatoriamente estar dentro desta tolerância mais restrita.

Note
Nota

Certifique-se de que a<ba<b e que seu subintervalo está dentro de [a,b][a,b]; caso contrário, é necessário ajustar os limites e considerar probabilidade 0 para intervalos fora do intervalo principal.

Distribuição normal

A distribuição normal descreve medições contínuas que se concentram em torno de uma média μμ com dispersão medida pelo desvio padrão σσ. Muitos erros de medição e variações naturais seguem essa curva em forma de sino.

Fórmula:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Padronize com o escore z:

z=xμσz = \frac{x-\mu}{\sigma}

A probabilidade entre dois valores utiliza a distribuição acumulada (CDF) ou simetria para casos padrão:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Aqui Φ\Phi é a CDF da normal padrão.

Exemplo A:

Parâmetros: μ=200μ=200, σ=5σ=5, encontrar P(195X205)P(195≤X≤205).

Escores z:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Utilizando a simetria da distribuição normal, a probabilidade entre 1−1 e +1+1 desvio padrão é a conhecida:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretação: Cerca de 68,27% dos pesos das hastes estão dentro de ±1 desvio padrão da média — a clássica "regra dos 68%".

Note
Nota

Quando os limites são simétricos em torno de utilize regras empíricas conhecidas (689599.768–95–99.7). Para outros limites, calcule e então utilize uma tabela ou calculadora.

question mark

Z-score para X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 10

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 1.96

bookCompreendendo Distribuições de Probabilidade

Deslize para mostrar o menu

Distribuições de probabilidade

Uma distribuição de probabilidade indica a probabilidade de diferentes resultados. Para resultados discretos (como "quantos bastões defeituosos"), listam-se as probabilidades para cada contagem possível. Para medições contínuas (como comprimento ou peso), descreve-se a densidade ao longo de um intervalo. Fórmulas gerais para casos discretos e contínuos:

P(XA)=xAp(x)(discreto)P(aXb)=abf(x)dx(contıˊnuo)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreto}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (contínuo)

Exemplo (verificação rápida): Se um processo garante que todos os comprimentos entre 49,5 e 50,5 cm são igualmente prováveis, a probabilidade de um bastão estar em um subintervalo de 0,4 cm será a largura do subintervalo dividida por 1,0 cm (essa é a ideia da distribuição uniforme — abaixo mostramos em detalhe).

Distribuição binomial

A binomial modela o número de sucessos (por exemplo, bastões defeituosos) em um número fixo de tentativas independentes (por exemplo, 100 bastões), quando cada tentativa tem a mesma probabilidade de sucesso.

Fórmula:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Exemplo:

Em um lote de n=100n=100 bastões onde cada bastão tem independentemente probabilidade p=0.02p=0.02 de ser defeituoso, qual a probabilidade de exatamente k=3k=3 bastões defeituosos?

Passo 1 — calcular a combinação:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Passo 2 — calcular as potências:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Passo 3 — multiplicar todas as partes:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Significado: Aproximadamente 18,23% de chance de exatamente 3 bastões defeituosos em uma amostra de 100 bastões. Se forem observados 3 defeitos, esse é um resultado plausível.

Note
Nota

Se a probabilidade calculada parecer maior que 1 ou negativa, verifique novamente o cálculo da combinação ou das potências. Também compare um valor da pmf binomial com a cdf se desejar respostas do tipo "no máximo" ou "pelo menos".

Distribuição uniforme

A distribuição uniforme modela uma medição contínua onde todo valor dentro de um intervalo [a,b] é igualmente provável (por exemplo, um intervalo de tolerância para o comprimento de uma haste).

Fórmula:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilidade entre dois pontos:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Exemplo:

Parâmetros: a=49.5, b=50.5. Qual a probabilidade de o comprimento de uma haste X estar entre 49.8 e 50.2? Calcule a largura do intervalo:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcule o subintervalo:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilidade:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretação: Há uma chance de 40% de uma haste medida aleatoriamente estar dentro desta tolerância mais restrita.

Note
Nota

Certifique-se de que a<ba<b e que seu subintervalo está dentro de [a,b][a,b]; caso contrário, é necessário ajustar os limites e considerar probabilidade 0 para intervalos fora do intervalo principal.

Distribuição normal

A distribuição normal descreve medições contínuas que se concentram em torno de uma média μμ com dispersão medida pelo desvio padrão σσ. Muitos erros de medição e variações naturais seguem essa curva em forma de sino.

Fórmula:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Padronize com o escore z:

z=xμσz = \frac{x-\mu}{\sigma}

A probabilidade entre dois valores utiliza a distribuição acumulada (CDF) ou simetria para casos padrão:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Aqui Φ\Phi é a CDF da normal padrão.

Exemplo A:

Parâmetros: μ=200μ=200, σ=5σ=5, encontrar P(195X205)P(195≤X≤205).

Escores z:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Utilizando a simetria da distribuição normal, a probabilidade entre 1−1 e +1+1 desvio padrão é a conhecida:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretação: Cerca de 68,27% dos pesos das hastes estão dentro de ±1 desvio padrão da média — a clássica "regra dos 68%".

Note
Nota

Quando os limites são simétricos em torno de utilize regras empíricas conhecidas (689599.768–95–99.7). Para outros limites, calcule e então utilize uma tabela ou calculadora.

question mark

Z-score para X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 10
some-alt