Lernen Herleitung der PCA mittels linearer Algebra | Mathematische Grundlagen der PCA

PCA sucht ein neues Satz von Achsen, genannt Hauptkomponenten (principal components), sodass die projizierten Daten maximale Varianz aufweisen. Die erste Hauptkomponente, bezeichnet als $w_{\raisebox{-0.5pt}{$1$}}$ , wird so gewählt, dass die Varianz der projizierten Daten maximiert wird:

\mathrm{Var}(X w_1)

Unter der Nebenbedingung, dass $\|w_{\raisebox{-0.5pt}{$1$}}\| = 1$ gilt. Die Lösung dieses Maximierungsproblems ist der Eigenvektor der Kovarianzmatrix, der zum größten Eigenwert gehört.

Das Optimierungsproblem lautet:

\max_{w} \ w^T \Sigma w \quad \text{unter der Nebenbedingung} \quad \|w\| = 1

Die Lösung ist jeder Vektor $w$ , der $\Sigma w = \lambda w$ erfüllt, wobei $\lambda$ der zugehörige Eigenwert ist. Mit anderen Worten: $w$ ist ein Eigenvektor der Kovarianzmatrix $\Sigma$ , der mit dem Eigenwert $\lambda$ assoziiert ist.


              12345678910111213
            
import numpy as np

# Assume cov_matrix from earlier
X = np.array([[2.5, 2.4],
              [0.5, 0.7],
              [2.2, 2.9]])
X_centered = X - np.mean(X, axis=0)
cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0]

# Find the principal component (eigenvector with largest eigenvalue)
values, vectors = np.linalg.eig(cov_matrix)
principal_component = vectors[:, np.argmax(values)]
print("First principal component:", principal_component)

Diese Hauptkomponente ist die Richtung, entlang der die Daten die höchste Varianz aufweisen. Die Projektion der Daten auf diese Richtung liefert die informativste eindimensionale Darstellung des ursprünglichen Datensatzes.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 3

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain why the principal component is important in PCA?

How do I interpret the values of the principal component?

What does projecting data onto the principal component mean?

Swipe um das Menü anzuzeigen

\mathrm{Var}(X w_1)

Unter der Nebenbedingung, dass $\|w_{\raisebox{-0.5pt}{$1$}}\| = 1$ gilt. Die Lösung dieses Maximierungsproblems ist der Eigenvektor der Kovarianzmatrix, der zum größten Eigenwert gehört.

Das Optimierungsproblem lautet:

\max_{w} \ w^T \Sigma w \quad \text{unter der Nebenbedingung} \quad \|w\| = 1


              12345678910111213
            
import numpy as np

# Assume cov_matrix from earlier
X = np.array([[2.5, 2.4],
              [0.5, 0.7],
              [2.2, 2.9]])
X_centered = X - np.mean(X, axis=0)
cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0]

# Find the principal component (eigenvector with largest eigenvalue)
values, vectors = np.linalg.eig(cov_matrix)
principal_component = vectors[:, np.argmax(values)]
print("First principal component:", principal_component)

War alles klar?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 3