Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Inzicht in Kansverdelingen | Kansrekening & Statistiek
Wiskunde voor Data Science

bookInzicht in Kansverdelingen

Kansverdelingen

Een kansverdeling geeft aan hoe waarschijnlijk verschillende uitkomsten zijn. Bij discrete uitkomsten (zoals "hoeveel defecte staven") geven we de kansen voor elk mogelijk aantal. Voor continue metingen (zoals lengte of gewicht) beschrijven we de dichtheid over een bereik. Algemene discrete versus continue formules:

P(XA)=xAp(x)(discreet)P(aXb)=abf(x)dx(continu)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreet}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continu)

Voorbeeld (snelle controle): Als een proces garandeert dat alle lengtes tussen 49,5 en 50,5 cm even waarschijnlijk zijn, dan is de kans dat een staaf in een subbereik van 0,4 cm ligt gelijk aan de breedte van het subbereik gedeeld door 1,0 cm (dit is het uniforme idee — hieronder tonen we dit in detail).

Binomiale verdeling

De binomiale verdeling modelleert het aantal successen (bijv. defecte staven) in een vast aantal onafhankelijke pogingen (bijv. 100 staven), waarbij elke poging dezelfde kans op succes heeft.

Formule:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Voorbeeld:

In een partij van n=100n=100 staven waarbij elke staaf onafhankelijk een kans p=0.02p=0.02 heeft om defect te zijn, wat is de kans op precies k=3k=3 defecte staven?

Stap 1 — bereken de combinatie:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Stap 2 — bereken de machten:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Stap 3 — vermenigvuldig alle delen:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Betekenis: Ongeveer 18,23% kans op precies 3 defecte staven in een steekproef van 100 staven. Als je 3 defecten ziet, is dat een aannemelijke uitkomst.

Note
Opmerking

Als de berekende kans groter lijkt dan 1 of negatief is, controleer dan de combinatie- of machtsberekeningen opnieuw. Vergelijk ook een binomiale pmf-waarde met de cdf als je een antwoord wilt voor "hoogstens" of "ten minste".

Uniforme verdeling

De uniforme verdeling modelleert een continue meting waarbij elke waarde binnen een bereik [a,b] even waarschijnlijk is (bijvoorbeeld een tolerantiebereik voor staaflengte).

Formule:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Kans tussen twee punten:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Voorbeeld:

Parameters: a=49.5, b=50.5. Wat is de kans dat een staaflengte X tussen 49.8 en 50.2 ligt? Bereken de breedte van het bereik:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Bereken het sub-interval:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Kans:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretatie: Er is een kans van 40% dat een willekeurig gemeten staaf binnen deze strakkere tolerantie valt.

Note
Opmerking

Zorg ervoor dat a<ba<b en dat uw sub-bereik binnen [a,b][a,b] ligt; anders moet u de uiteinden afkappen en buitenliggende bereiken behandelen met kans 0.

Normale verdeling

De normale verdeling beschrijft continue metingen die zich groeperen rond een gemiddelde μμ met spreiding gemeten door de standaardafwijking σσ. Veel meetfouten en natuurlijke variaties volgen deze klokvormige curve.

Formule:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standaardiseren met z-score:

z=xμσz = \frac{x-\mu}{\sigma}

Kans tussen twee waarden gebruikt de cumulatieve verdelingsfunctie (CDF) of symmetrie voor standaardgevallen:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Hier is Φ\Phi de standaard normale CDF.

Voorbeeld A:

Parameters: μ=200μ=200, σ=5σ=5, bepaal P(195X205)P(195≤X≤205).

Z-scores:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Met behulp van de symmetrie van de normale verdeling is de kans tussen 1−1 en +1+1 standaardafwijking de bekende:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretatie: Ongeveer 68,27% van de staafgewichten valt binnen ±1 standaardafwijking van het gemiddelde — de klassieke "68%-regel".

Note
Opmerking

Wanneer de grenzen symmetrisch zijn rond gebruik bekende empirische regels (689599.768–95–99.7). Voor andere grenzen, bereken en gebruik vervolgens een tabel of rekenmachine.

question mark

Z-score voor X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 10

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain the difference between discrete and continuous probability distributions again?

How do I know which distribution to use for a given problem?

Can you walk me through another example using one of these distributions?

Awesome!

Completion rate improved to 1.96

bookInzicht in Kansverdelingen

Veeg om het menu te tonen

Kansverdelingen

Een kansverdeling geeft aan hoe waarschijnlijk verschillende uitkomsten zijn. Bij discrete uitkomsten (zoals "hoeveel defecte staven") geven we de kansen voor elk mogelijk aantal. Voor continue metingen (zoals lengte of gewicht) beschrijven we de dichtheid over een bereik. Algemene discrete versus continue formules:

P(XA)=xAp(x)(discreet)P(aXb)=abf(x)dx(continu)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{discreet}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (continu)

Voorbeeld (snelle controle): Als een proces garandeert dat alle lengtes tussen 49,5 en 50,5 cm even waarschijnlijk zijn, dan is de kans dat een staaf in een subbereik van 0,4 cm ligt gelijk aan de breedte van het subbereik gedeeld door 1,0 cm (dit is het uniforme idee — hieronder tonen we dit in detail).

Binomiale verdeling

De binomiale verdeling modelleert het aantal successen (bijv. defecte staven) in een vast aantal onafhankelijke pogingen (bijv. 100 staven), waarbij elke poging dezelfde kans op succes heeft.

Formule:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Voorbeeld:

In een partij van n=100n=100 staven waarbij elke staaf onafhankelijk een kans p=0.02p=0.02 heeft om defect te zijn, wat is de kans op precies k=3k=3 defecte staven?

Stap 1 — bereken de combinatie:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Stap 2 — bereken de machten:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Stap 3 — vermenigvuldig alle delen:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Betekenis: Ongeveer 18,23% kans op precies 3 defecte staven in een steekproef van 100 staven. Als je 3 defecten ziet, is dat een aannemelijke uitkomst.

Note
Opmerking

Als de berekende kans groter lijkt dan 1 of negatief is, controleer dan de combinatie- of machtsberekeningen opnieuw. Vergelijk ook een binomiale pmf-waarde met de cdf als je een antwoord wilt voor "hoogstens" of "ten minste".

Uniforme verdeling

De uniforme verdeling modelleert een continue meting waarbij elke waarde binnen een bereik [a,b] even waarschijnlijk is (bijvoorbeeld een tolerantiebereik voor staaflengte).

Formule:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Kans tussen twee punten:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Voorbeeld:

Parameters: a=49.5, b=50.5. Wat is de kans dat een staaflengte X tussen 49.8 en 50.2 ligt? Bereken de breedte van het bereik:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Bereken het sub-interval:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Kans:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretatie: Er is een kans van 40% dat een willekeurig gemeten staaf binnen deze strakkere tolerantie valt.

Note
Opmerking

Zorg ervoor dat a<ba<b en dat uw sub-bereik binnen [a,b][a,b] ligt; anders moet u de uiteinden afkappen en buitenliggende bereiken behandelen met kans 0.

Normale verdeling

De normale verdeling beschrijft continue metingen die zich groeperen rond een gemiddelde μμ met spreiding gemeten door de standaardafwijking σσ. Veel meetfouten en natuurlijke variaties volgen deze klokvormige curve.

Formule:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standaardiseren met z-score:

z=xμσz = \frac{x-\mu}{\sigma}

Kans tussen twee waarden gebruikt de cumulatieve verdelingsfunctie (CDF) of symmetrie voor standaardgevallen:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Hier is Φ\Phi de standaard normale CDF.

Voorbeeld A:

Parameters: μ=200μ=200, σ=5σ=5, bepaal P(195X205)P(195≤X≤205).

Z-scores:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Met behulp van de symmetrie van de normale verdeling is de kans tussen 1−1 en +1+1 standaardafwijking de bekende:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretatie: Ongeveer 68,27% van de staafgewichten valt binnen ±1 standaardafwijking van het gemiddelde — de klassieke "68%-regel".

Note
Opmerking

Wanneer de grenzen symmetrisch zijn rond gebruik bekende empirische regels (689599.768–95–99.7). Voor andere grenzen, bereken en gebruik vervolgens een tabel of rekenmachine.

question mark

Z-score voor X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 10
some-alt