Kursinhalt
Fortgeschrittene Wahrscheinlichkeitstheorie
Fortgeschrittene Wahrscheinlichkeitstheorie
Kumulative Verteilungsfunktionen und Wahrscheinlichkeitsdichtefunktionen
Kumulative Verteilungsfunktion (CDF)
Die Kumulative Verteilungsfunktion (CDF) ist eine Funktion, die die kumulative Wahrscheinlichkeit beschreibt, dass eine Zufallsvariable einen Wert annimmt, der kleiner oder gleich einem gegebenen Wert ist.
Mathematisch wird die CDF einer Zufallsvariable X, bezeichnet als F(x), definiert als:
F(x) = Probability that variable X is less or equal to value x
.
Mit dieser Funktion ist es einfach, kontinuierliche Zufallsvariablen zu beschreiben.
Schauen Sie sich das folgende Beispiel an: Wir werden eine normalverteilte Zufallsvariable verwenden und ihre CDF mit der .cdf()
-Methode betrachten.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm # Generate a random variable following a normal distribution mu = 0 # mean sigma = 1 # standard deviation x = np.linspace(-5, 5, 100) # x values rv = norm(loc=mu, scale=sigma) # create a normal distribution with given mean and standard deviation # Compute the CDF for the random variable cdf = rv.cdf(x) # Plot the CDF plt.plot(x, cdf, label='CDF') plt.xlabel('X') plt.ylabel('CDF') plt.title('CDF of a Standard Normal Distribution') plt.legend() plt.show()
Mit der Kumulativen Verteilungsfunktion (CDF) können wir die Wahrscheinlichkeit bestimmen, dass unsere Zufallsvariable zu einem der interessierenden Intervalle gehört. Angenommen, X ist eine Zufallsvariable und F(x) ist ihre CDF.
Um die Wahrscheinlichkeit zu bestimmen, dass die Variable X zum Intervall [a, b] gehört, können wir die folgende Formel verwenden:
P{X є [a,b]} = F(b) - F(a)
.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm # Generate a random variable following a normal distribution mu = 0 # mean sigma = 1 # standard deviation rv = norm(loc=mu, scale=sigma) # Calculate probabilities for different ranges print('Normally distributed variable belongs to [-1, 1] with probability:', round(rv.cdf(1) - rv.cdf(-1), 3)) print('Normally distributed variable belongs to [-2, 2] with probability:', round(rv.cdf(2) - rv.cdf(-2), 3)) print('Normally distributed variable belongs to [-3, 3] with probability:', round(rv.cdf(3) - rv.cdf(-3), 3))
Percent Point Function (PPF)
Percent Point Function (PPF), auch bekannt als die Inverse der Kumulativen Verteilungsfunktion (CDF). Sie wird verwendet, um den Wert einer Zufallsvariable zu finden, der einer gegebenen Wahrscheinlichkeit entspricht. In Python wird sie mit der Methode .ppf()
implementiert:
from scipy.stats import norm # Define probabilities probabilities = [0.1, 0.5, 0.85] # Iterate over each probability and print the corresponding value of the variable for i in probabilities: # Calculate the value of the variable using the percent point function (inverse of the cumulative distribution function) value = norm.ppf(i) # Round the value to 3 decimal places for clarity value = round(value, 3) # Print the result print('Normally distributed variable is less than', value, 'with probability', i)
Wahrscheinlichkeitsdichtefunktion (PDF)
Wahrscheinlichkeitsdichtefunktion (PDF) ist eine Funktion, die Informationen über die Wahrscheinlichkeit liefert, dass eine Zufallsvariable an einem bestimmten Punkt im kontinuierlichen Bereich einen bestimmten Wert annimmt. Ihre Interpretation ist ähnlich der der PMF, wird jedoch speziell zur Beschreibung kontinuierlicher Zufallsvariablen verwendet.
Die PDF definiert die Form der Wahrscheinlichkeitsverteilung einer kontinuierlichen Zufallsvariablen.
Betrachten wir das folgende Beispiel einer PDF, die mit der .pdf()
-Methode berechnet wurde.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm # Generate x values for plotting x = np.linspace(-3, 3, 100) # Calculate the probability density function (PDF) values for the standard normal distribution pdf_values = norm.pdf(x, loc=0, scale=1) # Plot the PDF plt.plot(x, pdf_values, label='PDF') # Plot PDF values against x values plt.xlabel('X') # Label for x-axis plt.ylabel('PDF') # Label for y-axis plt.title('PDF of a Standard Normal Distribution') # Title of the plot plt.legend() # Show legend plt.show() # Display the plot
Das PDF bietet Einblick in die Wahrscheinlichkeit oder Wahrscheinlichkeitsdichte, dass eine Zufallsvariable einen bestimmten Wert annimmt. Höhere PDF-Werte deuten auf eine größere Wahrscheinlichkeit hin, während niedrigere Werte auf eine geringere Wahrscheinlichkeit hindeuten.
Um die Wahrscheinlichkeit zu bestimmen, dass eine kontinuierliche Variable in einen bestimmten Bereich fällt, ähnlich wie bei der Verwendung der PMF, berechnen wir die Summe des PDF für alle Werte innerhalb dieses Bereichs. Da kontinuierliche Variablen jedoch eine unendliche Anzahl von Werten innerhalb eines Bereichs haben können, berechnen wir stattdessen die Fläche unter der PDF-Kurve innerhalb des angegebenen Bereichs anstelle einer einfachen Summe.
Danke für Ihr Feedback!