Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Verständnis von Wahrscheinlichkeitsverteilungen | Wahrscheinlichkeit & Statistik
Mathematik für Data Science

bookVerständnis von Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen

Eine Wahrscheinlichkeitsverteilung gibt an, wie wahrscheinlich verschiedene Ergebnisse sind. Bei diskreten Ergebnissen (wie "Anzahl defekter Stäbe") werden die Wahrscheinlichkeiten für jede mögliche Anzahl aufgelistet. Bei kontinuierlichen Messungen (wie Länge oder Gewicht) wird die Dichte über einen Bereich beschrieben. Allgemeine Formeln für diskrete vs. kontinuierliche Verteilungen:

P(XA)=xAp(x)(diskret)P(aXb)=abf(x)dx(kontinuierlich)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (kontinuierlich)

Beispiel (schnelle Überprüfung): Wenn ein Prozess garantiert, dass alle Längen zwischen 49,5 und 50,5 cm gleich wahrscheinlich sind, ist die Wahrscheinlichkeit, dass ein Stab in einem 0,4 cm breiten Teilbereich liegt, gleich der Teilbereichsbreite geteilt durch 1,0 cm (dies ist die Idee der Gleichverteilung — unten zeigen wir dies im Detail).

Binomialverteilung

Die Binomialverteilung modelliert die Anzahl der Erfolge (z. B. defekte Stäbe) in einer festen Anzahl unabhängiger Versuche (z. B. 100 Stäbe), wobei jeder Versuch die gleiche Erfolgswahrscheinlichkeit hat.

Formel:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Beispiel:

In einer Charge von n=100n=100 Stäben, bei der jeder Stab unabhängig mit Wahrscheinlichkeit p=0.02p=0.02 defekt ist, wie groß ist die Wahrscheinlichkeit, dass genau k=3k=3 Stäbe defekt sind?

Schritt 1 — Kombination berechnen:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Schritt 2 — Potenzen berechnen:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Schritt 3 — Alle Teile multiplizieren:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Bedeutung: Etwa 18,23 % Wahrscheinlichkeit, dass in einer Stichprobe von 100 Stäben genau 3 defekt sind. Wenn Sie 3 Defekte sehen, ist das ein plausibles Ergebnis.

Note
Hinweis

Wenn die berechnete Wahrscheinlichkeit größer als 1 oder negativ erscheint, überprüfen Sie die Kombination oder die Potenzberechnungen. Vergleichen Sie außerdem einen Wert der Binomial-pmf mit der cdf, wenn Sie "höchstens"- oder "mindestens"-Antworten benötigen.

Gleichverteilung

Die Gleichverteilung modelliert eine kontinuierliche Messung, bei der jeder Wert innerhalb eines Bereichs [a,b] gleich wahrscheinlich ist (z. B. ein Toleranzbereich für Stablängen).

Formel:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Wahrscheinlichkeit zwischen zwei Punkten:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Beispiel:

Parameter: a=49.5, b=50.5. Wie groß ist die Wahrscheinlichkeit, dass eine Stablänge X zwischen 49.8 und 50.2 liegt? Berechnung der Bereichsbreite:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Berechnung des Teilintervalls:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Wahrscheinlichkeit:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretation: Es besteht eine 40%ige Wahrscheinlichkeit, dass ein zufällig gemessener Stab in diesen engeren Toleranzbereich fällt.

Note
Hinweis

Stellen Sie sicher, dass a<ba<b gilt und Ihr Teilbereich innerhalb von [a,b][a,b] liegt; andernfalls müssen Sie die Endpunkte anpassen und Bereiche außerhalb mit Wahrscheinlichkeit 0 behandeln.

Normalverteilung

Die Normalverteilung beschreibt kontinuierliche Messungen, die sich um einen Mittelwert μμ gruppieren, wobei die Streuung durch die Standardabweichung σσ gemessen wird. Viele Messfehler und natürliche Schwankungen folgen dieser glockenförmigen Kurve.

Formel:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardisierung mit z-Score:

z=xμσz = \frac{x-\mu}{\sigma}

Die Wahrscheinlichkeit zwischen zwei Werten wird mit der kumulierten Verteilungsfunktion (CDF) oder Symmetrie für Standardfälle berechnet:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Hierbei ist Φ\Phi die Standardnormalverteilungsfunktion (CDF).

Beispiel A:

Parameter: μ=200μ=200, σ=5σ=5, gesucht ist P(195X205)P(195≤X≤205).

z-Scores:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Unter Ausnutzung der Symmetrie der Normalverteilung ergibt sich für den Bereich zwischen 1−1 und +1+1 Standardabweichung die bekannte Wahrscheinlichkeit:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretation: Etwa 68,27% der Stabgewichte liegen innerhalb von ±1 Standardabweichung um den Mittelwert — die klassische "68%-Regel".

Note
Hinweis

Wenn die Grenzen symmetrisch um liegen, bekannte empirische Regeln (689599.768–95–99.7) anwenden. Für andere Grenzen berechnen und dann eine Tabelle oder einen Rechner verwenden.

question mark

Z-Score für X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 10

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain the difference between discrete and continuous probability distributions again?

How do I know which distribution to use for a given problem?

Can you walk me through another example using one of these distributions?

Awesome!

Completion rate improved to 1.96

bookVerständnis von Wahrscheinlichkeitsverteilungen

Swipe um das Menü anzuzeigen

Wahrscheinlichkeitsverteilungen

Eine Wahrscheinlichkeitsverteilung gibt an, wie wahrscheinlich verschiedene Ergebnisse sind. Bei diskreten Ergebnissen (wie "Anzahl defekter Stäbe") werden die Wahrscheinlichkeiten für jede mögliche Anzahl aufgelistet. Bei kontinuierlichen Messungen (wie Länge oder Gewicht) wird die Dichte über einen Bereich beschrieben. Allgemeine Formeln für diskrete vs. kontinuierliche Verteilungen:

P(XA)=xAp(x)(diskret)P(aXb)=abf(x)dx(kontinuierlich)P(X \in A) = \sum_{x \in A}p(x)\quad(\text{diskret}) \\[6pt] P(a \le X \le b) = \int_a^b f(x)dx \quad (kontinuierlich)

Beispiel (schnelle Überprüfung): Wenn ein Prozess garantiert, dass alle Längen zwischen 49,5 und 50,5 cm gleich wahrscheinlich sind, ist die Wahrscheinlichkeit, dass ein Stab in einem 0,4 cm breiten Teilbereich liegt, gleich der Teilbereichsbreite geteilt durch 1,0 cm (dies ist die Idee der Gleichverteilung — unten zeigen wir dies im Detail).

Binomialverteilung

Die Binomialverteilung modelliert die Anzahl der Erfolge (z. B. defekte Stäbe) in einer festen Anzahl unabhängiger Versuche (z. B. 100 Stäbe), wobei jeder Versuch die gleiche Erfolgswahrscheinlichkeit hat.

Formel:

P(X=k)=(nk)pk(1p)nkP(X = k) = \begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}

Beispiel:

In einer Charge von n=100n=100 Stäben, bei der jeder Stab unabhängig mit Wahrscheinlichkeit p=0.02p=0.02 defekt ist, wie groß ist die Wahrscheinlichkeit, dass genau k=3k=3 Stäbe defekt sind?

Schritt 1 — Kombination berechnen:

(1003)=100!3!97!=161700\begin{pmatrix}100 \\ 3\end{pmatrix} = \frac{100!}{3!97!} = 161700

Schritt 2 — Potenzen berechnen:

p3=0.023=0.000008(1p)97=0.98970.1409059532p^3 = 0.02^3 = 0.000008 \\ (1-p)^{97} = 0.98^{97} \approx 0.1409059532

Schritt 3 — Alle Teile multiplizieren:

P(X=3)=161700×0.000008×0.14090595320.182275941P(X = 3) = 161700 \times 0.000008 \times 0.1409059532 \approx 0.182275941

Bedeutung: Etwa 18,23 % Wahrscheinlichkeit, dass in einer Stichprobe von 100 Stäben genau 3 defekt sind. Wenn Sie 3 Defekte sehen, ist das ein plausibles Ergebnis.

Note
Hinweis

Wenn die berechnete Wahrscheinlichkeit größer als 1 oder negativ erscheint, überprüfen Sie die Kombination oder die Potenzberechnungen. Vergleichen Sie außerdem einen Wert der Binomial-pmf mit der cdf, wenn Sie "höchstens"- oder "mindestens"-Antworten benötigen.

Gleichverteilung

Die Gleichverteilung modelliert eine kontinuierliche Messung, bei der jeder Wert innerhalb eines Bereichs [a,b] gleich wahrscheinlich ist (z. B. ein Toleranzbereich für Stablängen).

Formel:

f(x)=1ba,axbf(x) = \frac{1}{b-a},\quad a \le x \le b

Wahrscheinlichkeit zwischen zwei Punkten:

P(lXu)=ulbaP(l \le X \le u) = \frac{u - l}{b - a}

Beispiel:

Parameter: a=49.5, b=50.5. Wie groß ist die Wahrscheinlichkeit, dass eine Stablänge X zwischen 49.8 und 50.2 liegt? Berechnung der Bereichsbreite:

ba=50.549.5=1.0b-a = 50.5 - 49.5 = 1.0

Berechnung des Teilintervalls:

ul=50.249.8=0.4u - l = 50.2 - 49.8 = 0.4

Wahrscheinlichkeit:

P(49.8X50.2)=0.41.0=0.4P(49.8 \le X \le 50.2) = \frac{0.4}{1.0} = 0.4

Interpretation: Es besteht eine 40%ige Wahrscheinlichkeit, dass ein zufällig gemessener Stab in diesen engeren Toleranzbereich fällt.

Note
Hinweis

Stellen Sie sicher, dass a<ba<b gilt und Ihr Teilbereich innerhalb von [a,b][a,b] liegt; andernfalls müssen Sie die Endpunkte anpassen und Bereiche außerhalb mit Wahrscheinlichkeit 0 behandeln.

Normalverteilung

Die Normalverteilung beschreibt kontinuierliche Messungen, die sich um einen Mittelwert μμ gruppieren, wobei die Streuung durch die Standardabweichung σσ gemessen wird. Viele Messfehler und natürliche Schwankungen folgen dieser glockenförmigen Kurve.

Formel:

f(x)=1σ2πe(xμ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Standardisierung mit z-Score:

z=xμσz = \frac{x-\mu}{\sigma}

Die Wahrscheinlichkeit zwischen zwei Werten wird mit der kumulierten Verteilungsfunktion (CDF) oder Symmetrie für Standardfälle berechnet:

P(aXb)=Φ(bμσ)Φ(aμσ)P(a \le X \le b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

Hierbei ist Φ\Phi die Standardnormalverteilungsfunktion (CDF).

Beispiel A:

Parameter: μ=200μ=200, σ=5σ=5, gesucht ist P(195X205)P(195≤X≤205).

z-Scores:

z1=1952005=1z2=2052005=1z_1 = \frac{195 - 200}{5} = -1 \\[6pt] z_2 = \frac{205 - 200}{5} = 1

Unter Ausnutzung der Symmetrie der Normalverteilung ergibt sich für den Bereich zwischen 1−1 und +1+1 Standardabweichung die bekannte Wahrscheinlichkeit:

P(195X205)0.6826894921P(195 \le X \le 205) \approx 0.6826894921

Interpretation: Etwa 68,27% der Stabgewichte liegen innerhalb von ±1 Standardabweichung um den Mittelwert — die klassische "68%-Regel".

Note
Hinweis

Wenn die Grenzen symmetrisch um liegen, bekannte empirische Regeln (689599.768–95–99.7) anwenden. Für andere Grenzen berechnen und dann eine Tabelle oder einen Rechner verwenden.

question mark

Z-Score für X=195X=195, μ=200μ=200, σ=5σ=5?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 10
some-alt