Lernen Kumulative Verteilungsfunktionen und Wahrscheinlichkeitsdichtefunktionen | Zusätzliche Aussagen Aus Der Wahrscheinlichkeitstheorie

Kumulative Verteilungsfunktion (CDF)

Die Kumulative Verteilungsfunktion (CDF) ist eine Funktion, die die kumulative Wahrscheinlichkeit beschreibt, dass eine Zufallsvariable einen Wert annimmt, der kleiner oder gleich einem gegebenen Wert ist.

Mathematisch wird die CDF einer Zufallsvariable X, bezeichnet als F(x), definiert als:

F(x) = Probability that variable X is less or equal to value x.

Mit dieser Funktion ist es einfach, kontinuierliche Zufallsvariablen zu beschreiben.
Schauen Sie sich das folgende Beispiel an: Wir werden eine normalverteilte Zufallsvariable verwenden und ihre CDF mit der .cdf()-Methode betrachten.


              1234567891011121314151617181920
            
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Generate a random variable following a normal distribution
mu = 0  # mean
sigma = 1  # standard deviation
x = np.linspace(-5, 5, 100)  # x values
rv = norm(loc=mu, scale=sigma)  # create a normal distribution with given mean and standard deviation

# Compute the CDF for the random variable
cdf = rv.cdf(x)

# Plot the CDF
plt.plot(x, cdf, label='CDF')
plt.xlabel('X')
plt.ylabel('CDF')
plt.title('CDF of a Standard Normal Distribution')
plt.legend()
plt.show()

Mit der Kumulativen Verteilungsfunktion (CDF) können wir die Wahrscheinlichkeit bestimmen, dass unsere Zufallsvariable zu einem der interessierenden Intervalle gehört. Angenommen, X ist eine Zufallsvariable und F(x) ist ihre CDF.
Um die Wahrscheinlichkeit zu bestimmen, dass die Variable X zum Intervall [a, b] gehört, können wir die folgende Formel verwenden:

P{X є [a,b]} = F(b) - F(a).


              12345678910111213
            
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Generate a random variable following a normal distribution
mu = 0  # mean
sigma = 1  # standard deviation
rv = norm(loc=mu, scale=sigma) 

# Calculate probabilities for different ranges
print('Normally distributed variable belongs to [-1, 1] with probability:', round(rv.cdf(1) - rv.cdf(-1), 3))
print('Normally distributed variable belongs to [-2, 2] with probability:', round(rv.cdf(2) - rv.cdf(-2), 3))
print('Normally distributed variable belongs to [-3, 3] with probability:', round(rv.cdf(3) - rv.cdf(-3), 3))

Percent Point Function (PPF)

Percent Point Function (PPF), auch bekannt als die Inverse der Kumulativen Verteilungsfunktion (CDF). Sie wird verwendet, um den Wert einer Zufallsvariable zu finden, der einer gegebenen Wahrscheinlichkeit entspricht. In Python wird sie mit der Methode .ppf() implementiert:


              12345678910111213
            
from scipy.stats import norm

# Define probabilities
probabilities = [0.1, 0.5, 0.85]

# Iterate over each probability and print the corresponding value of the variable
for i in probabilities:
    # Calculate the value of the variable using the percent point function (inverse of the cumulative distribution function)
    value = norm.ppf(i)
    # Round the value to 3 decimal places for clarity
    value = round(value, 3)
    # Print the result
    print('Normally distributed variable is less than', value, 'with probability', i)

Wahrscheinlichkeitsdichtefunktion (PDF)

Wahrscheinlichkeitsdichtefunktion (PDF) ist eine Funktion, die Informationen über die Wahrscheinlichkeit liefert, dass eine Zufallsvariable an einem bestimmten Punkt im kontinuierlichen Bereich einen bestimmten Wert annimmt. Ihre Interpretation ist ähnlich der der PMF, wird jedoch speziell zur Beschreibung kontinuierlicher Zufallsvariablen verwendet.

Die PDF definiert die Form der Wahrscheinlichkeitsverteilung einer kontinuierlichen Zufallsvariablen.

Betrachten wir das folgende Beispiel einer PDF, die mit der .pdf()-Methode berechnet wurde.


              1234567891011121314151617
            
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Generate x values for plotting
x = np.linspace(-3, 3, 100)

# Calculate the probability density function (PDF) values for the standard normal distribution
pdf_values = norm.pdf(x, loc=0, scale=1)

# Plot the PDF
plt.plot(x, pdf_values, label='PDF')  # Plot PDF values against x values
plt.xlabel('X')  # Label for x-axis
plt.ylabel('PDF')  # Label for y-axis
plt.title('PDF of a Standard Normal Distribution')  # Title of the plot
plt.legend()  # Show legend
plt.show()  # Display the plot

Das PDF bietet Einblick in die Wahrscheinlichkeit oder Wahrscheinlichkeitsdichte, dass eine Zufallsvariable einen bestimmten Wert annimmt. Höhere PDF-Werte deuten auf eine größere Wahrscheinlichkeit hin, während niedrigere Werte auf eine geringere Wahrscheinlichkeit hindeuten.

Um die Wahrscheinlichkeit zu bestimmen, dass eine kontinuierliche Variable in einen bestimmten Bereich fällt, ähnlich wie bei der Verwendung der PMF, berechnen wir die Summe des PDF für alle Werte innerhalb dieses Bereichs. Da kontinuierliche Variablen jedoch eine unendliche Anzahl von Werten innerhalb eines Bereichs haben können, berechnen wir stattdessen die Fläche unter der PDF-Kurve innerhalb des angegebenen Bereichs anstelle einer einfachen Summe.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 3

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Swipe um das Menü anzuzeigen