Kursinhalt

Grundlagen der Wahrscheinlichkeitstheorie

1. Grundlagen der Wahrscheinlichkeitstheorie

Stochastisches Experiment und Zufälliges Ereignis Wahrscheinlichkeit und Ihre Eigenschaften Geometrische Wahrscheinlichkeit Herausforderung: Lösung der Aufgabe mit Geometrischer Wahrscheinlichkeit Unabhängigkeit und Unvereinbarkeit Zufälliger Ereignisse Bedingte Wahrscheinlichkeit

2. Wahrscheinlichkeit Komplexer Ereignisse

Inklusions-Exklusions-Prinzip Herausforderung: Lösung der Aufgabe mit dem Prinzip der Inklusion-Exklusion Die Multiplikationsregel der Wahrscheinlichkeit Gesetz Der Totalen Wahrscheinlichkeit Bayes' Theorem Herausforderung: Lösung der Aufgabe mit dem Satz von Bayes

3. Häufig Verwendete Diskrete Verteilungen

Binomialverteilung Herausforderung: Aufgabe Mit Binomialverteilung Lösen Multinomiale Verteilung Geometrische Verteilung Poisson-Verteilung Herausforderung: Aufgabe Mit Poisson-Verteilung Lösen

4. Häufig Verwendete Kontinuierliche Verteilungen

Stetige Gleichverteilung Exponentialverteilung Herausforderung: Aufgabe Mit Exponentialverteilung Lösen Normalverteilung Herausforderung: Aufgabe mit Gaussian-Verteilung Lösen

5. Kovarianz und Korrelation

Was Ist Kovarianz?Was Ist Korrelation?Herausforderung: Lösung der Aufgabe mit Korrelation

Was Ist Kovarianz?

Kovarianz ist ein numerisches Maß, das die Beziehung zwischen zwei Variablen quantifiziert.
Es misst, wie Änderungen in einer Variablen mit Änderungen in einer anderen Variablen einhergehen. Genauer gesagt, misst die Kovarianz die gemeinsame Variabilität zweier Variablen und liefert Einblicke in die Richtung (positiv oder negativ) dieser Variabilität.

Berechnung der Kovarianz

Führe das erste stochastische Experiment mehrmals durch und notiere die Ergebnisse jedes Experiments in einem Array. Dies wird ein x-Array sein;
Führe das zweite stochastische Experiment mehrmals durch und notiere die Ergebnisse in dem y-Array;
Berechne die Kovarianz mit der numpy-Bibliothek: covariance = np.cov(x, y)[0, 1].

Beispiele


              12345678910111213141516171819
            
import numpy as np
import matplotlib.pyplot as plt

# Assume that results of some stochastic experiments are stored in x array
x = np.random.rand(100) * 10
# We provide another stochastic experiment by using the value of x and adding some noise
y = x + np.random.randn(100)

# Calculate the covariance
covariance = np.cov(x, y)[0, 1]
plt.scatter(x, y)

# Add labels and title
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Covariance is '+ str(round(covariance, 3) ))

# Show the plot
plt.show()

Wir sehen, dass mit steigendem x-Wert auch der y-Wert zunimmt. Daher ist die Korrelation positiv. Lassen Sie uns ein weiteres Experiment durchführen:


              12345678910111213141516171819
            
import numpy as np
import matplotlib.pyplot as plt

# Assume that resylts of some stohastic experiments are stored in x array
x = np.random.rand(100) * 10
# We provide another stohastic experiment by using the value of -x and adding some noise
y = -x + np.random.randn(100)

# Calculate the covariance
covariance = np.cov(x, y)[0, 1]
plt.scatter(x, y)

# Add labels and title
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Covariance is '+ str(round(covariance, 3) ))

# Show the plot
plt.show()

Nun, während der x-Wert zunimmt, sinkt der y-Wert und die Kovarianz ist negativ. Schauen wir uns nun die Kovariation zwischen den Ergebnissen von zwei unabhängigen Experimenten an:


              1234567891011121314151617181920
            
import numpy as np
import matplotlib.pyplot as plt

# Generate random data for two variables with zero correlation
np.random.seed(0)
x = np.random.rand(200)
y = np.random.rand(200)

# Calculate the covariance
covariance = np.cov(x, y)[0, 1]

plt.scatter(x, y)

# Add labels and title
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Covariance is '+ str(round(covariance, 3) ))

# Show the plot
plt.show()

Folglich können wir die folgende Schlussfolgerung ziehen:

Wenn die Kovarianz zwischen zwei Werten positiv ist, steigt auch der zweite Wert, wenn der erste Wert zunimmt;
Wenn die Kovarianz zwischen zwei Werten negativ ist, sinkt der zweite Wert, wenn der erste Wert zunimmt;
Sind die Werte unabhängig, dann ist ihre Korrelation null (sie sind unkorreliert).

Beachte den letzten Punkt: Die Korrelation ist null, wenn die Werte unabhängig sind. Aber das Umgekehrte gilt nicht: nur weil die Korrelation null ist, bedeutet das nicht, dass sie unabhängig sind. Schau dir das Beispiel an:


              1234567891011121314151617181920212223242526
            
import numpy as np
import matplotlib.pyplot as plt

# Set the number of vectors/points to generate
num_points = 1000

# Generate random angles uniformly distributed between 0 and 2*pi
angles = np.random.uniform(0, 2*np.pi, num_points)

# Convert angles to vectors in polar coordinates
r = np.sqrt(np.random.uniform(0, 1, num_points))  # Square root to achieve uniform distribution within the circle
x = r * np.cos(angles)
y = r * np.sin(angles)

# Calculate the covariance
covariance = np.cov(x, y)[0, 1]

plt.scatter(x, y)

# Add labels and title
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Covariance is '+ str(round(covariance, 3) ))

# Show the plot
plt.show()

Die Punkte im obigen Beispiel liegen innerhalb des Einheitskreises und sind daher abhängig, aber unkorreliert.
Im Allgemeinen können nur lineare Zusammenhänge zwischen Werten mithilfe der Kovarianz gut identifiziert werden. Daher können wir im Fall unkorrelierter Werte schließen, dass sie keine linearen Abhängigkeiten aufweisen, jedoch möglicherweise andere, komplexere Arten von Abhängigkeiten haben.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 1

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen