Varianza, Covarianza y la Matriz de Covarianza
Varianza mide cuánto se desvía una variable de su media.
La fórmula para la varianza de una variable x es:
Var(x)=n1i=1∑n(xi−xˉ)2Covarianza mide cómo varían conjuntamente dos variables.
La fórmula para la covarianza de las variables x y y es:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matriz de covarianza generaliza la covarianza a múltiples variables. Para un conjunto de datos X con d características y n muestras, la matriz de covarianza Σ es una matriz de d×d donde cada elemento Σij es la covarianza entre la característica i y la característica j, calculada con denominador n−1 para ser un estimador insesgado.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
En el código anterior, los datos se centran manualmente y se calcula la matriz de covarianza utilizando multiplicación de matrices. Esta matriz refleja cómo varía cada par de características en conjunto.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 8.33
Varianza, Covarianza y la Matriz de Covarianza
Desliza para mostrar el menú
Varianza mide cuánto se desvía una variable de su media.
La fórmula para la varianza de una variable x es:
Var(x)=n1i=1∑n(xi−xˉ)2Covarianza mide cómo varían conjuntamente dos variables.
La fórmula para la covarianza de las variables x y y es:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matriz de covarianza generaliza la covarianza a múltiples variables. Para un conjunto de datos X con d características y n muestras, la matriz de covarianza Σ es una matriz de d×d donde cada elemento Σij es la covarianza entre la característica i y la característica j, calculada con denominador n−1 para ser un estimador insesgado.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
En el código anterior, los datos se centran manualmente y se calcula la matriz de covarianza utilizando multiplicación de matrices. Esta matriz refleja cómo varía cada par de características en conjunto.
¡Gracias por tus comentarios!