Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Forståelse av Sannsynlighetsfordelinger | Sannsynlighet og Statistikk
Matematikk for Datavitenskap

bookForståelse av Sannsynlighetsfordelinger

Sannsynlighetsfordelinger

En sannsynlighetsfordeling angir hvor sannsynlige ulike utfall er. For diskrete utfall (som "antall defekte stenger") oppgis sannsynligheten for hvert mulig antall. For kontinuerlige målinger (som lengde eller vekt) beskrives tettheten over et intervall. Generelle formler for diskrete og kontinuerlige tilfeller:

P(XA)=xAp(x)(diskret)P(aXb)=abf(x)dx(kontinuerlig)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (kontinuerlig)

Eksempel (hurtigsjekk): Hvis en prosess garanterer at alle lengder mellom 49,5 og 50,5 cm er like sannsynlige, vil sannsynligheten for at en stang havner i et 0,4 cm delintervall være delintervallbredden delt på 1,0 cm (dette er uniform-fordelingen — nedenfor vises dette i detalj).

Binomisk fordeling

Den binomiske fordelingen modellerer antall suksesser (f.eks. defekte stenger) i et fast antall uavhengige forsøk (f.eks. 100 stenger), der hvert forsøk har samme sannsynlighet for suksess.

Formel:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Eksempel:

I et parti med n=100n=100 stenger der hver stang uavhengig har sannsynlighet p=0.02p=0.02 for å være defekt, hva er sannsynligheten for nøyaktig k=3k=3 defekte stenger?

Steg 1 — beregn kombinasjonen:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Steg 2 — beregn potenser:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Steg 3 — multipliser alle deler:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Hva dette betyr: Omtrent 18,23 % sannsynlighet for nøyaktig 3 defekte stenger i et utvalg på 100 stenger. Hvis du observerer 3 defekter, er det et plausibelt utfall.

Note
Merk

Hvis den beregnede sannsynligheten virker større enn 1 eller negativ, bør du kontrollere kombinasjons- eller potensberegningene. Sammenlign også en binomisk pmf-verdi med cdf hvis du ønsker svar for "høyest" eller "minst".

Uniform fordeling

Den uniforme fordelingen modellerer en kontinuerlig måling der alle verdier innenfor et intervall [a,b] er like sannsynlige (for eksempel et toleranseintervall for stanglengde).

Formel:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Sannsynlighet mellom to punkter:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Eksempel:

Parametere: a=49.5, b=50.5. Hva er sannsynligheten for at en stanglengde X ligger mellom 49.8 og 50.2? Beregn intervallbredde:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Beregn delintervall:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Sannsynlighet:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Tolkning: Det er 40% sannsynlighet for at en tilfeldig målt stang havner innenfor dette strammere toleranseintervallet.

Note
Merk

Sørg for at a<ba<b og at delintervallet ditt er innenfor [a,b][a,b]; ellers må du klippe endepunktene og behandle områder utenfor som sannsynlighet 0.

Normalfordeling

Normalfordelingen beskriver kontinuerlige målinger som samler seg rundt et gjennomsnitt μμ med spredning målt ved standardavvik σσ. Mange målefeil og naturlige variasjoner følger denne klokkeformede kurven.

Formel:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardiser med z-score:

z=xμσz = \frac{x-\mu}{\sigma}

Sannsynlighet mellom to verdier bruker den kumulative fordelingsfunksjonen (CDF) eller symmetri for standardtilfeller:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Her er Φ\Phi den standard normal CDF.

Eksempel A:

Parametere: μ=200μ=200, σ=5σ=5, finn P(195X205)P(195≤X≤205).

Z-skårer:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Ved å bruke symmetrien til normalfordelingen er sannsynligheten mellom 1−1 og +1+1 standardavvik den velkjente:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Tolkning: Omtrent 68,27% av stangvektene faller innenfor ±1 standardavvik fra gjennomsnittet — en klassisk "68%-regel".

Note
Merk

Når grensene er symmetriske rundt bruk kjente empiriske regler (689599.768–95–99.7). For andre grenser, beregn og bruk deretter en tabell eller kalkulator.

question mark

Z-score for X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 10

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 1.96

bookForståelse av Sannsynlighetsfordelinger

Sveip for å vise menyen

Sannsynlighetsfordelinger

En sannsynlighetsfordeling angir hvor sannsynlige ulike utfall er. For diskrete utfall (som "antall defekte stenger") oppgis sannsynligheten for hvert mulig antall. For kontinuerlige målinger (som lengde eller vekt) beskrives tettheten over et intervall. Generelle formler for diskrete og kontinuerlige tilfeller:

P(XA)=xAp(x)(diskret)P(aXb)=abf(x)dx(kontinuerlig)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (kontinuerlig)

Eksempel (hurtigsjekk): Hvis en prosess garanterer at alle lengder mellom 49,5 og 50,5 cm er like sannsynlige, vil sannsynligheten for at en stang havner i et 0,4 cm delintervall være delintervallbredden delt på 1,0 cm (dette er uniform-fordelingen — nedenfor vises dette i detalj).

Binomisk fordeling

Den binomiske fordelingen modellerer antall suksesser (f.eks. defekte stenger) i et fast antall uavhengige forsøk (f.eks. 100 stenger), der hvert forsøk har samme sannsynlighet for suksess.

Formel:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Eksempel:

I et parti med n=100n=100 stenger der hver stang uavhengig har sannsynlighet p=0.02p=0.02 for å være defekt, hva er sannsynligheten for nøyaktig k=3k=3 defekte stenger?

Steg 1 — beregn kombinasjonen:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Steg 2 — beregn potenser:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Steg 3 — multipliser alle deler:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Hva dette betyr: Omtrent 18,23 % sannsynlighet for nøyaktig 3 defekte stenger i et utvalg på 100 stenger. Hvis du observerer 3 defekter, er det et plausibelt utfall.

Note
Merk

Hvis den beregnede sannsynligheten virker større enn 1 eller negativ, bør du kontrollere kombinasjons- eller potensberegningene. Sammenlign også en binomisk pmf-verdi med cdf hvis du ønsker svar for "høyest" eller "minst".

Uniform fordeling

Den uniforme fordelingen modellerer en kontinuerlig måling der alle verdier innenfor et intervall [a,b] er like sannsynlige (for eksempel et toleranseintervall for stanglengde).

Formel:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Sannsynlighet mellom to punkter:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Eksempel:

Parametere: a=49.5, b=50.5. Hva er sannsynligheten for at en stanglengde X ligger mellom 49.8 og 50.2? Beregn intervallbredde:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Beregn delintervall:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Sannsynlighet:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Tolkning: Det er 40% sannsynlighet for at en tilfeldig målt stang havner innenfor dette strammere toleranseintervallet.

Note
Merk

Sørg for at a<ba<b og at delintervallet ditt er innenfor [a,b][a,b]; ellers må du klippe endepunktene og behandle områder utenfor som sannsynlighet 0.

Normalfordeling

Normalfordelingen beskriver kontinuerlige målinger som samler seg rundt et gjennomsnitt μμ med spredning målt ved standardavvik σσ. Mange målefeil og naturlige variasjoner følger denne klokkeformede kurven.

Formel:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardiser med z-score:

z=xμσz = \frac{x-\mu}{\sigma}

Sannsynlighet mellom to verdier bruker den kumulative fordelingsfunksjonen (CDF) eller symmetri for standardtilfeller:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Her er Φ\Phi den standard normal CDF.

Eksempel A:

Parametere: μ=200μ=200, σ=5σ=5, finn P(195X205)P(195≤X≤205).

Z-skårer:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Ved å bruke symmetrien til normalfordelingen er sannsynligheten mellom 1−1 og +1+1 standardavvik den velkjente:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Tolkning: Omtrent 68,27% av stangvektene faller innenfor ±1 standardavvik fra gjennomsnittet — en klassisk "68%-regel".

Note
Merk

Når grensene er symmetriske rundt bruk kjente empiriske regler (689599.768–95–99.7). For andre grenser, beregn og bruk deretter en tabell eller kalkulator.

question mark

Z-score for X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 10
some-alt