Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Variância, Covariância e a Matriz de Covariância | Fundamentos Matemáticos do PCA
Redução de Dimensionalidade com PCA

bookVariância, Covariância e a Matriz de Covariância

Note
Definição

Variância mede o quanto uma variável se desvia de sua média.

A fórmula para a variância de uma variável xx é:

Var(x)=1ni=1n(xixˉ)2\mathrm{Var}(x) = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
Note
Definição

Covariância mede como duas variáveis variam juntas.

A fórmula para a Covariância das variáveis xx e yy é:

Cov(x,y)=1n1i=1n(xixˉ)(yiyˉ)\mathrm{Cov}(x, y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})

A matriz de covariância generaliza a covariância para múltiplas variáveis. Para um conjunto de dados XX com dd características e nn amostras, a matriz de covariância Σ\Sigma é uma matriz d×dd \times d onde cada elemento Σij\Sigma_{ij} representa a covariância entre a característica ii e a característica jj, calculada com o denominador n1n-1 para ser um estimador não tendencioso.

12345678910111213
import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
copy

No código acima, os dados são centralizados manualmente e a matriz de covariância é calculada utilizando multiplicação de matrizes. Essa matriz representa como cada par de características varia em conjunto.

question mark

Qual afirmação descreve com precisão a relação entre variância, covariância e a matriz de covariância

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 1

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain why we center the data before computing the covariance matrix?

What is the difference between dividing by n and n-1 in the covariance calculation?

How do I interpret the values in the covariance matrix?

Awesome!

Completion rate improved to 8.33

bookVariância, Covariância e a Matriz de Covariância

Deslize para mostrar o menu

Note
Definição

Variância mede o quanto uma variável se desvia de sua média.

A fórmula para a variância de uma variável xx é:

Var(x)=1ni=1n(xixˉ)2\mathrm{Var}(x) = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
Note
Definição

Covariância mede como duas variáveis variam juntas.

A fórmula para a Covariância das variáveis xx e yy é:

Cov(x,y)=1n1i=1n(xixˉ)(yiyˉ)\mathrm{Cov}(x, y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})

A matriz de covariância generaliza a covariância para múltiplas variáveis. Para um conjunto de dados XX com dd características e nn amostras, a matriz de covariância Σ\Sigma é uma matriz d×dd \times d onde cada elemento Σij\Sigma_{ij} representa a covariância entre a característica ii e a característica jj, calculada com o denominador n1n-1 para ser um estimador não tendencioso.

12345678910111213
import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
copy

No código acima, os dados são centralizados manualmente e a matriz de covariância é calculada utilizando multiplicação de matrizes. Essa matriz representa como cada par de características varia em conjunto.

question mark

Qual afirmação descreve com precisão a relação entre variância, covariância e a matriz de covariância

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 2. Capítulo 1
some-alt