Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Todennäköisyysjakaumien Ymmärtäminen | Todennäköisyys ja Tilastotiede
Matematiikka Data-analytiikkaan

bookTodennäköisyysjakaumien Ymmärtäminen

Todennäköisyysjakaumat

Todennäköisyysjakauma kertoo, kuinka todennäköisiä eri lopputulokset ovat. Diskreettien tulosten tapauksessa (esim. "kuinka monta viallista tankoa") luetellaan todennäköisyydet jokaiselle mahdolliselle määrälle. Jatkuvien suureiden tapauksessa (esim. pituus tai paino) kuvataan tiheys tietyllä välillä. Yleiset kaavat diskreeteille ja jatkuville jakaumille:

P(XA)=xAp(x)(diskreetti)P(aXb)=abf(x)dx(jatkuva)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskreetti}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (jatkuva)

Esimerkki (pikatarkistus): Jos prosessi takaa, että kaikki pituudet välillä 49,5 ja 50,5 cm ovat yhtä todennäköisiä, todennäköisyys, että tanko osuu 0,4 cm:n osa-alueelle, on osa-alueen leveys jaettuna 1,0 cm:llä (tämä on tasajakauman periaate — alla näytetään se tarkemmin).

Binomijakauma

Binomijakauma mallintaa onnistumisten määrää (esim. viallisten tankojen määrä) kiinteässä määrässä toisistaan riippumattomia kokeita (esim. 100 tankoa), kun jokaisella kokeella on sama onnistumistodennäköisyys.

Kaava:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Esimerkki:

Erässä, jossa n=100n=100 tankoa ja jokaisella tangolla on itsenäisesti todennäköisyys p=0.02p=0.02 olla viallinen, mikä on todennäköisyys, että tarkalleen k=3k=3 tankoa on viallisia?

Vaihe 1 — laske yhdistelmät:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Vaihe 2 — laske potenssit:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Vaihe 3 — kerro kaikki osat keskenään:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Mitä tämä tarkoittaa: Noin 18,23 % todennäköisyys, että 100 tangon otoksessa on tarkalleen 3 viallista tankoa. Jos havaitset 3 vikaa, se on mahdollinen lopputulos.

Note
Huomio

Jos laskettu todennäköisyys vaikuttaa suuremmalta kuin 1 tai negatiiviselta, tarkista yhdistelmien ja potenssien laskut. Vertaa myös binomijakauman pmf-arvoa cdf-arvoon, jos haluat vastauksen "enintään" tai "vähintään" tilanteisiin.

Tasainen jakauma

Tasainen jakauma mallintaa jatkuvaa mittausta, jossa jokainen arvo välillä [a,b] on yhtä todennäköinen (esim. sallitun pituuden toleranssialue sauvalle).

Kaava:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Todennäköisyys kahden pisteen välillä:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Esimerkki:

Parametrit: a=49.5, b=50.5. Mikä on todennäköisyys, että sauvan pituus X on välillä 49.8 ja 50.2? Laske alueen leveys:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Laske osa-alue:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Todennäköisyys:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Tulkinta: On 40 %:n todennäköisyys, että satunnaisesti mitattu sauva osuu tähän tiukempaan toleranssiin.

Note
Huomio

Varmista, että a<ba<b ja alialueesi on sisällä [a,b][a,b]; muuten päätepisteet tulee rajata ja ulkopuolisille alueille todennäköisyys on 0.

Normaalijakauma

Normaalijakauma kuvaa jatkuvia mittauksia, jotka keskittyvät keskiarvon μμ ympärille ja joiden hajonta mitataan keskihajonnalla σσ. Monet mittausvirheet ja luonnolliset vaihtelut noudattavat tätä kellonmuotoista käyrää.

Kaava:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardoi z-arvolla:

z=xμσz = \frac{x-\mu}{\sigma}

Todennäköisyys kahden arvon välillä lasketaan kertymäfunktion (CDF) tai symmetrian avulla vakioissa tapauksissa:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Tässä Φ\Phi on normaalijakauman kertymäfunktio.

Esimerkki A:

Parametrit: μ=200μ=200, σ=5σ=5, etsi P(195X205)P(195≤X≤205).

Z-arvot:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Normaalijakauman symmetrian perusteella todennäköisyys välillä 1−1 ja +1+1 keskihajontaa on tunnettu:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Tulkinta: Noin 68,27 % sauvojen painoista sijoittuu keskiarvon ±1 keskihajonnan sisään — klassinen "68 %:n sääntö".

Note
Huomio

Kun rajat ovat symmetriset keskiarvon ympärillä, käytä tunnettuja empiirisiä sääntöjä (689599.768–95–99.7). Muihin rajoihin laske ensin z-arvo ja käytä sitten taulukkoa tai laskinta.

question mark

Z-arvo, kun X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 10

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between discrete and continuous probability distributions again?

How do I know which distribution to use for a given problem?

Can you walk me through another example using one of these distributions?

Awesome!

Completion rate improved to 1.96

bookTodennäköisyysjakaumien Ymmärtäminen

Pyyhkäise näyttääksesi valikon

Todennäköisyysjakaumat

Todennäköisyysjakauma kertoo, kuinka todennäköisiä eri lopputulokset ovat. Diskreettien tulosten tapauksessa (esim. "kuinka monta viallista tankoa") luetellaan todennäköisyydet jokaiselle mahdolliselle määrälle. Jatkuvien suureiden tapauksessa (esim. pituus tai paino) kuvataan tiheys tietyllä välillä. Yleiset kaavat diskreeteille ja jatkuville jakaumille:

P(XA)=xAp(x)(diskreetti)P(aXb)=abf(x)dx(jatkuva)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskreetti}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (jatkuva)

Esimerkki (pikatarkistus): Jos prosessi takaa, että kaikki pituudet välillä 49,5 ja 50,5 cm ovat yhtä todennäköisiä, todennäköisyys, että tanko osuu 0,4 cm:n osa-alueelle, on osa-alueen leveys jaettuna 1,0 cm:llä (tämä on tasajakauman periaate — alla näytetään se tarkemmin).

Binomijakauma

Binomijakauma mallintaa onnistumisten määrää (esim. viallisten tankojen määrä) kiinteässä määrässä toisistaan riippumattomia kokeita (esim. 100 tankoa), kun jokaisella kokeella on sama onnistumistodennäköisyys.

Kaava:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Esimerkki:

Erässä, jossa n=100n=100 tankoa ja jokaisella tangolla on itsenäisesti todennäköisyys p=0.02p=0.02 olla viallinen, mikä on todennäköisyys, että tarkalleen k=3k=3 tankoa on viallisia?

Vaihe 1 — laske yhdistelmät:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Vaihe 2 — laske potenssit:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Vaihe 3 — kerro kaikki osat keskenään:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Mitä tämä tarkoittaa: Noin 18,23 % todennäköisyys, että 100 tangon otoksessa on tarkalleen 3 viallista tankoa. Jos havaitset 3 vikaa, se on mahdollinen lopputulos.

Note
Huomio

Jos laskettu todennäköisyys vaikuttaa suuremmalta kuin 1 tai negatiiviselta, tarkista yhdistelmien ja potenssien laskut. Vertaa myös binomijakauman pmf-arvoa cdf-arvoon, jos haluat vastauksen "enintään" tai "vähintään" tilanteisiin.

Tasainen jakauma

Tasainen jakauma mallintaa jatkuvaa mittausta, jossa jokainen arvo välillä [a,b] on yhtä todennäköinen (esim. sallitun pituuden toleranssialue sauvalle).

Kaava:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Todennäköisyys kahden pisteen välillä:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Esimerkki:

Parametrit: a=49.5, b=50.5. Mikä on todennäköisyys, että sauvan pituus X on välillä 49.8 ja 50.2? Laske alueen leveys:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Laske osa-alue:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Todennäköisyys:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Tulkinta: On 40 %:n todennäköisyys, että satunnaisesti mitattu sauva osuu tähän tiukempaan toleranssiin.

Note
Huomio

Varmista, että a<ba<b ja alialueesi on sisällä [a,b][a,b]; muuten päätepisteet tulee rajata ja ulkopuolisille alueille todennäköisyys on 0.

Normaalijakauma

Normaalijakauma kuvaa jatkuvia mittauksia, jotka keskittyvät keskiarvon μμ ympärille ja joiden hajonta mitataan keskihajonnalla σσ. Monet mittausvirheet ja luonnolliset vaihtelut noudattavat tätä kellonmuotoista käyrää.

Kaava:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardoi z-arvolla:

z=xμσz = \frac{x-\mu}{\sigma}

Todennäköisyys kahden arvon välillä lasketaan kertymäfunktion (CDF) tai symmetrian avulla vakioissa tapauksissa:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Tässä Φ\Phi on normaalijakauman kertymäfunktio.

Esimerkki A:

Parametrit: μ=200μ=200, σ=5σ=5, etsi P(195X205)P(195≤X≤205).

Z-arvot:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Normaalijakauman symmetrian perusteella todennäköisyys välillä 1−1 ja +1+1 keskihajontaa on tunnettu:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Tulkinta: Noin 68,27 % sauvojen painoista sijoittuu keskiarvon ±1 keskihajonnan sisään — klassinen "68 %:n sääntö".

Note
Huomio

Kun rajat ovat symmetriset keskiarvon ympärillä, käytä tunnettuja empiirisiä sääntöjä (689599.768–95–99.7). Muihin rajoihin laske ensin z-arvo ja käytä sitten taulukkoa tai laskinta.

question mark

Z-arvo, kun X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 5. Luku 10
some-alt