Aprenda Derivação da PCA Usando Álgebra Linear | Fundamentos Matemáticos do PCA

A ACP busca um novo conjunto de eixos, chamados de componentes principais, de modo que os dados projetados apresentem variância máxima. O primeiro componente principal, denotado como $w_{\raisebox{-0.5pt}{$1$}}$ , é escolhido para maximizar a variância dos dados projetados:

\mathrm{Var}(X w_1)

Sujeito à restrição de que $\|w_{\raisebox{-0.5pt}{$1$}}\| = 1$ . A solução para este problema de maximização é o autovetor da matriz de covariância correspondente ao maior autovalor.

O problema de otimização é:

\max_{w} \ w^T \Sigma w \quad \text{subject to} \quad \|w\| = 1

A solução é qualquer vetor $w$ que satisfaça $\Sigma w = \lambda w$ , onde $\lambda$ é o autovalor correspondente. Em outras palavras, $w$ é um autovetor da matriz de covariância $\Sigma$ associado ao autovalor $\lambda$ .


              12345678910111213
            
import numpy as np

# Assume cov_matrix from earlier
X = np.array([[2.5, 2.4],
              [0.5, 0.7],
              [2.2, 2.9]])
X_centered = X - np.mean(X, axis=0)
cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0]

# Find the principal component (eigenvector with largest eigenvalue)
values, vectors = np.linalg.eig(cov_matrix)
principal_component = vectors[:, np.argmax(values)]
print("First principal component:", principal_component)

Este componente principal é a direção ao longo da qual os dados apresentam a maior variância. Projetar os dados nesta direção fornece a representação unidimensional mais informativa do conjunto de dados original.

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 2. Capítulo 3

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain why the principal component is important in PCA?

How do I interpret the values of the principal component?

What does projecting data onto the principal component mean?

Deslize para mostrar o menu

\mathrm{Var}(X w_1)

Sujeito à restrição de que $\|w_{\raisebox{-0.5pt}{$1$}}\| = 1$ . A solução para este problema de maximização é o autovetor da matriz de covariância correspondente ao maior autovalor.

O problema de otimização é:

\max_{w} \ w^T \Sigma w \quad \text{subject to} \quad \|w\| = 1


              12345678910111213
            
import numpy as np

# Assume cov_matrix from earlier
X = np.array([[2.5, 2.4],
              [0.5, 0.7],
              [2.2, 2.9]])
X_centered = X - np.mean(X, axis=0)
cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0]

# Find the principal component (eigenvector with largest eigenvalue)
values, vectors = np.linalg.eig(cov_matrix)
principal_component = vectors[:, np.argmax(values)]
print("First principal component:", principal_component)

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 2. Capítulo 3