Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Comprensión de las Distribuciones de Probabilidad | Probabilidad y Estadística
Matemáticas para Ciencia de Datos

bookComprensión de las Distribuciones de Probabilidad

Distribuciones de probabilidad

Una distribución de probabilidad indica cuán probables son diferentes resultados. Por un lado, en resultados discretos (como "cuántas varillas defectuosas"), se listan las probabilidades para cada cantidad posible. Para mediciones continuas (como longitud o peso), en cambio, se describe la densidad a lo largo de un rango. Fórmulas generales para discretas vs continuas:

P(XA)=xAp(x)(discreta)P(aXb)=abf(x)dx(continua)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreta}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continua)

Ejemplo (verificación rápida): Si un proceso garantiza que todas las longitudes entre 49.5 y 50.5 cm son igualmente probables, la probabilidad de que una varilla esté en un subrango de 0.4 cm será el ancho del subrango dividido por 1.0 cm (esta es la idea uniforme — abajo se muestra en detalle).

Distribución binomial

La binomial modela el número de éxitos (por ejemplo, varillas defectuosas) en un número fijo de ensayos independientes (por ejemplo, 100 varillas), cuando cada ensayo tiene la misma probabilidad de éxito.

Fórmula:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Ejemplo:

En un lote de n=100n=100 varillas donde cada varilla tiene independientemente una probabilidad p=0.02p=0.02 de ser defectuosa, ¿cuál es la probabilidad de exactamente k=3k=3 varillas defectuosas?

Paso 1 — calcular la combinación:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Paso 2 — calcular las potencias:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Paso 3 — multiplicar todas las partes:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Significado: Aproximadamente 18.23% de probabilidad de exactamente 3 varillas defectuosas en una muestra de 100 varillas. Si se observan 3 defectos, es un resultado plausible.

Note
Nota

Si la probabilidad calculada parece mayor que 1 o negativa, revise el cálculo de la combinación o de las potencias. También compare un valor de la función de masa de probabilidad binomial (pmf) con la función de distribución acumulada (cdf) si desea respuestas de "a lo sumo" o "al menos".

Distribución uniforme

La distribución uniforme modela una medición continua donde cada valor dentro de un rango [a,b] es igualmente probable (por ejemplo, un rango de tolerancia para la longitud de una varilla).

Fórmula:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilidad entre dos puntos:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Ejemplo:

Parámetros: a=49.5, b=50.5. ¿Cuál es la probabilidad de que la longitud de una varilla X esté entre 49.8 y 50.2? Calcular el ancho del rango:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcular el sub-intervalo:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilidad:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretación: Hay un 40% de probabilidad de que una varilla medida al azar caiga dentro de esta tolerancia más estricta.

Note
Nota

Asegúrese de que a<ba<b y que su subrango esté dentro de [a,b][a,b]; de lo contrario, debe recortar los extremos y tratar los rangos fuera de los límites con probabilidad 0.

Distribución normal

La distribución normal describe mediciones continuas que se agrupan alrededor de una media μμ con una dispersión medida por la desviación estándar σσ. Muchos errores de medición y variaciones naturales siguen esta curva en forma de campana.

Fórmula:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Estandarización con puntuación z:

z=xμσz = \frac{x-\mu}{\sigma}

La probabilidad entre dos valores utiliza la función de distribución acumulada (CDF) o la simetría para casos estándar:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Aquí Φ\Phi es la CDF normal estándar.

Ejemplo A:

Parámetros: μ=200μ=200, σ=5σ=5, encontrar P(195X205)P(195≤X≤205).

Puntuaciones z:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Usando la simetría de la distribución normal, la probabilidad entre 1−1 y +1+1 desviación estándar es la conocida:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretación: Aproximadamente el 68.27% de los pesos de las varillas caen dentro de ±1 desviación estándar de la media — la clásica "regla del 68%".

Note
Nota

Cuando los límites son simétricos alrededor de utilice las reglas empíricas conocidas (689599.768–95–99.7). Para otros límites, calcule y luego utilice una tabla o calculadora.

question mark

¿Puntaje Z para X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 10

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you explain the difference between discrete and continuous probability distributions again?

How do I know which distribution to use for a given problem?

Can you walk me through another example using one of these distributions?

Awesome!

Completion rate improved to 1.96

bookComprensión de las Distribuciones de Probabilidad

Desliza para mostrar el menú

Distribuciones de probabilidad

Una distribución de probabilidad indica cuán probables son diferentes resultados. Por un lado, en resultados discretos (como "cuántas varillas defectuosas"), se listan las probabilidades para cada cantidad posible. Para mediciones continuas (como longitud o peso), en cambio, se describe la densidad a lo largo de un rango. Fórmulas generales para discretas vs continuas:

P(XA)=xAp(x)(discreta)P(aXb)=abf(x)dx(continua)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreta}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continua)

Ejemplo (verificación rápida): Si un proceso garantiza que todas las longitudes entre 49.5 y 50.5 cm son igualmente probables, la probabilidad de que una varilla esté en un subrango de 0.4 cm será el ancho del subrango dividido por 1.0 cm (esta es la idea uniforme — abajo se muestra en detalle).

Distribución binomial

La binomial modela el número de éxitos (por ejemplo, varillas defectuosas) en un número fijo de ensayos independientes (por ejemplo, 100 varillas), cuando cada ensayo tiene la misma probabilidad de éxito.

Fórmula:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Ejemplo:

En un lote de n=100n=100 varillas donde cada varilla tiene independientemente una probabilidad p=0.02p=0.02 de ser defectuosa, ¿cuál es la probabilidad de exactamente k=3k=3 varillas defectuosas?

Paso 1 — calcular la combinación:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Paso 2 — calcular las potencias:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Paso 3 — multiplicar todas las partes:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Significado: Aproximadamente 18.23% de probabilidad de exactamente 3 varillas defectuosas en una muestra de 100 varillas. Si se observan 3 defectos, es un resultado plausible.

Note
Nota

Si la probabilidad calculada parece mayor que 1 o negativa, revise el cálculo de la combinación o de las potencias. También compare un valor de la función de masa de probabilidad binomial (pmf) con la función de distribución acumulada (cdf) si desea respuestas de "a lo sumo" o "al menos".

Distribución uniforme

La distribución uniforme modela una medición continua donde cada valor dentro de un rango [a,b] es igualmente probable (por ejemplo, un rango de tolerancia para la longitud de una varilla).

Fórmula:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Probabilidad entre dos puntos:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Ejemplo:

Parámetros: a=49.5, b=50.5. ¿Cuál es la probabilidad de que la longitud de una varilla X esté entre 49.8 y 50.2? Calcular el ancho del rango:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Calcular el sub-intervalo:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Probabilidad:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretación: Hay un 40% de probabilidad de que una varilla medida al azar caiga dentro de esta tolerancia más estricta.

Note
Nota

Asegúrese de que a<ba<b y que su subrango esté dentro de [a,b][a,b]; de lo contrario, debe recortar los extremos y tratar los rangos fuera de los límites con probabilidad 0.

Distribución normal

La distribución normal describe mediciones continuas que se agrupan alrededor de una media μμ con una dispersión medida por la desviación estándar σσ. Muchos errores de medición y variaciones naturales siguen esta curva en forma de campana.

Fórmula:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Estandarización con puntuación z:

z=xμσz = \frac{x-\mu}{\sigma}

La probabilidad entre dos valores utiliza la función de distribución acumulada (CDF) o la simetría para casos estándar:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Aquí Φ\Phi es la CDF normal estándar.

Ejemplo A:

Parámetros: μ=200μ=200, σ=5σ=5, encontrar P(195X205)P(195≤X≤205).

Puntuaciones z:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Usando la simetría de la distribución normal, la probabilidad entre 1−1 y +1+1 desviación estándar es la conocida:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretación: Aproximadamente el 68.27% de los pesos de las varillas caen dentro de ±1 desviación estándar de la media — la clásica "regla del 68%".

Note
Nota

Cuando los límites son simétricos alrededor de utilice las reglas empíricas conocidas (689599.768–95–99.7). Para otros límites, calcule y luego utilice una tabla o calculadora.

question mark

¿Puntaje Z para X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 10
some-alt