Variância, Covariância e a Matriz de Covariância
Variância mede o quanto uma variável se desvia de sua média.
A fórmula para a variância de uma variável x é:
Var(x)=n1i=1∑n(xi−xˉ)2Covariância mede como duas variáveis variam juntas.
A fórmula para a Covariância das variáveis x e y é:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)A matriz de covariância generaliza a covariância para múltiplas variáveis. Para um conjunto de dados X com d características e n amostras, a matriz de covariância Σ é uma matriz d×d onde cada elemento Σij representa a covariância entre a característica i e a característica j, calculada com o denominador n−1 para ser um estimador não tendencioso.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
No código acima, os dados são centralizados manualmente e a matriz de covariância é calculada utilizando multiplicação de matrizes. Essa matriz representa como cada par de características varia em conjunto.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Can you explain why we center the data before computing the covariance matrix?
What is the difference between dividing by n and n-1 in the covariance calculation?
How do I interpret the values in the covariance matrix?
Awesome!
Completion rate improved to 8.33
Variância, Covariância e a Matriz de Covariância
Deslize para mostrar o menu
Variância mede o quanto uma variável se desvia de sua média.
A fórmula para a variância de uma variável x é:
Var(x)=n1i=1∑n(xi−xˉ)2Covariância mede como duas variáveis variam juntas.
A fórmula para a Covariância das variáveis x e y é:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)A matriz de covariância generaliza a covariância para múltiplas variáveis. Para um conjunto de dados X com d características e n amostras, a matriz de covariância Σ é uma matriz d×d onde cada elemento Σij representa a covariância entre a característica i e a característica j, calculada com o denominador n−1 para ser um estimador não tendencioso.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
No código acima, os dados são centralizados manualmente e a matriz de covariância é calculada utilizando multiplicação de matrizes. Essa matriz representa como cada par de características varia em conjunto.
Obrigado pelo seu feedback!