Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Forståelse af Sandsynlighedsfordelinger | Sandsynlighed & Statistik
Matematik for Datavidenskab

bookForståelse af Sandsynlighedsfordelinger

Sandsynlighedsfordelinger

En sandsynlighedsfordeling angiver, hvor sandsynlige forskellige udfald er. For diskrete udfald (som "hvor mange defekte stænger") oplister vi sandsynligheder for hvert muligt antal. For kontinuerte målinger (som længde eller vægt) beskriver vi tæthed over et interval. Generelle formler for diskrete vs. kontinuerte fordelinger:

P(XA)=xAp(x)(diskret)P(aXb)=abf(x)dx(kontinuerlig)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (kontinuerlig)

Eksempel (hurtigt tjek): Hvis en proces garanterer, at alle længder mellem 49,5 og 50,5 cm er lige sandsynlige, vil sandsynligheden for, at en stang ligger i et 0,4 cm delinterval, være delintervallets bredde divideret med 1,0 cm (dette er uniform-fordelingen — nedenfor vises det i detaljer).

Binomialfordeling

Binomialfordelingen modellerer antallet af successer (f.eks. defekte stænger) i et fast antal uafhængige forsøg (f.eks. 100 stænger), hvor hvert forsøg har samme sandsynlighed for succes.

Formel:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Eksempel:

I et parti med n=100n=100 stænger, hvor hver stang uafhængigt har sandsynligheden p=0.02p=0.02 for at være defekt, hvad er sandsynligheden for præcis k=3k=3 defekte stænger?

Trin 1 — beregn kombinationen:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Trin 2 — beregn potenser:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Trin 3 — multiplicér alle dele:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Betydning: Cirka 18,23% sandsynlighed for præcis 3 defekte stænger i en prøve på 100 stænger. Hvis du ser 3 defekter, er det et sandsynligt udfald.

Note
Bemærk

Hvis din beregnede sandsynlighed virker større end 1 eller negativ, så tjek kombinations- eller potensberegningerne igen. Sammenlign også en binomial pmf-værdi med cdf, hvis du ønsker svar som "højst" eller "mindst".

Uniform fordeling

Den uniforme fordeling modellerer en kontinuerlig måling, hvor enhver værdi inden for intervallet [a,b] er lige sandsynlig (f.eks. et toleranceniveau for stanglængde).

Formel:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Sandsynlighed mellem to punkter:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Eksempel:

Parametre: a=49.5, b=50.5. Hvad er sandsynligheden for, at en stanglængde X ligger mellem 49.8 og 50.2? Beregn intervalbredde:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Beregn delinterval:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Sandsynlighed:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Fortolkning: Der er 40% sandsynlighed for, at en tilfældigt målt stang falder inden for dette snævrere toleranceinterval.

Note
Bemærk

Sørg for at a<ba<b og at dit delinterval er inden for [a,b][a,b]; ellers skal du afkorte endepunkterne og behandle værdier uden for intervallet med sandsynlighed 0.

Normal fordeling

Den normale fordeling beskriver kontinuerlige målinger, der samler sig omkring et gennemsnit μμ med spredning målt ved standardafvigelsen σσ. Mange målefejl og naturlige variationer følger denne klokkeformede kurve.

Formel:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardisering med z-score:

z=xμσz = \frac{x-\mu}{\sigma}

Sandsynligheden mellem to værdier beregnes med den kumulative fordelingsfunktion (CDF) eller symmetri for standardtilfælde:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Her er Φ\Phi den standard normale CDF.

Eksempel A:

Parametre: μ=200μ=200, σ=5σ=5, find P(195X205)P(195≤X≤205).

Z-scores:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Ved at bruge symmetrien i den normale fordeling er sandsynligheden mellem 1−1 og +1+1 standardafvigelse den velkendte:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Fortolkning: Omtrent 68,27% af stangvægtene ligger inden for ±1 standardafvigelse fra gennemsnittet — den klassiske "68%-regel".

Note
Bemærk

Når grænserne er symmetriske omkring anvendes kendte empiriske regler (689599.768–95–99.7). For andre grænser beregnes og derefter anvendes en tabel eller lommeregner.

question mark

Z-score for X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 10

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the difference between discrete and continuous probability distributions again?

How do I know which distribution to use for a given problem?

Can you walk me through another example using one of these distributions?

Awesome!

Completion rate improved to 1.96

bookForståelse af Sandsynlighedsfordelinger

Stryg for at vise menuen

Sandsynlighedsfordelinger

En sandsynlighedsfordeling angiver, hvor sandsynlige forskellige udfald er. For diskrete udfald (som "hvor mange defekte stænger") oplister vi sandsynligheder for hvert muligt antal. For kontinuerte målinger (som længde eller vægt) beskriver vi tæthed over et interval. Generelle formler for diskrete vs. kontinuerte fordelinger:

P(XA)=xAp(x)(diskret)P(aXb)=abf(x)dx(kontinuerlig)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (kontinuerlig)

Eksempel (hurtigt tjek): Hvis en proces garanterer, at alle længder mellem 49,5 og 50,5 cm er lige sandsynlige, vil sandsynligheden for, at en stang ligger i et 0,4 cm delinterval, være delintervallets bredde divideret med 1,0 cm (dette er uniform-fordelingen — nedenfor vises det i detaljer).

Binomialfordeling

Binomialfordelingen modellerer antallet af successer (f.eks. defekte stænger) i et fast antal uafhængige forsøg (f.eks. 100 stænger), hvor hvert forsøg har samme sandsynlighed for succes.

Formel:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Eksempel:

I et parti med n=100n=100 stænger, hvor hver stang uafhængigt har sandsynligheden p=0.02p=0.02 for at være defekt, hvad er sandsynligheden for præcis k=3k=3 defekte stænger?

Trin 1 — beregn kombinationen:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Trin 2 — beregn potenser:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Trin 3 — multiplicér alle dele:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Betydning: Cirka 18,23% sandsynlighed for præcis 3 defekte stænger i en prøve på 100 stænger. Hvis du ser 3 defekter, er det et sandsynligt udfald.

Note
Bemærk

Hvis din beregnede sandsynlighed virker større end 1 eller negativ, så tjek kombinations- eller potensberegningerne igen. Sammenlign også en binomial pmf-værdi med cdf, hvis du ønsker svar som "højst" eller "mindst".

Uniform fordeling

Den uniforme fordeling modellerer en kontinuerlig måling, hvor enhver værdi inden for intervallet [a,b] er lige sandsynlig (f.eks. et toleranceniveau for stanglængde).

Formel:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Sandsynlighed mellem to punkter:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Eksempel:

Parametre: a=49.5, b=50.5. Hvad er sandsynligheden for, at en stanglængde X ligger mellem 49.8 og 50.2? Beregn intervalbredde:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Beregn delinterval:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Sandsynlighed:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Fortolkning: Der er 40% sandsynlighed for, at en tilfældigt målt stang falder inden for dette snævrere toleranceinterval.

Note
Bemærk

Sørg for at a<ba<b og at dit delinterval er inden for [a,b][a,b]; ellers skal du afkorte endepunkterne og behandle værdier uden for intervallet med sandsynlighed 0.

Normal fordeling

Den normale fordeling beskriver kontinuerlige målinger, der samler sig omkring et gennemsnit μμ med spredning målt ved standardafvigelsen σσ. Mange målefejl og naturlige variationer følger denne klokkeformede kurve.

Formel:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardisering med z-score:

z=xμσz = \frac{x-\mu}{\sigma}

Sandsynligheden mellem to værdier beregnes med den kumulative fordelingsfunktion (CDF) eller symmetri for standardtilfælde:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Her er Φ\Phi den standard normale CDF.

Eksempel A:

Parametre: μ=200μ=200, σ=5σ=5, find P(195X205)P(195≤X≤205).

Z-scores:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Ved at bruge symmetrien i den normale fordeling er sandsynligheden mellem 1−1 og +1+1 standardafvigelse den velkendte:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Fortolkning: Omtrent 68,27% af stangvægtene ligger inden for ±1 standardafvigelse fra gennemsnittet — den klassiske "68%-regel".

Note
Bemærk

Når grænserne er symmetriske omkring anvendes kendte empiriske regler (689599.768–95–99.7). For andre grænser beregnes og derefter anvendes en tabel eller lommeregner.

question mark

Z-score for X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 10
some-alt