Variance, Covariance et Matrice de Covariance
Variance mesure dans quelle mesure une variable s'écarte de sa moyenne.
La formule de la variance d'une variable x est :
Var(x)=n1i=1∑n(xi−xˉ)2Covariance mesure comment deux variables évoluent ensemble.
La formule de la covariance entre les variables x et y est :
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matrice de covariance généralise la covariance à plusieurs variables. Pour un ensemble de données X avec d caractéristiques et n échantillons, la matrice de covariance Σ est une matrice d×d où chaque entrée Σij représente la covariance entre la caractéristique i et la caractéristique j, calculée avec le dénominateur n−1 afin d'obtenir un estimateur non biaisé.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Dans le code ci-dessus, les données sont centrées manuellement puis la matrice de covariance est calculée à l'aide de la multiplication matricielle. Cette matrice décrit comment chaque paire de caractéristiques varie ensemble.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 8.33
Variance, Covariance et Matrice de Covariance
Glissez pour afficher le menu
Variance mesure dans quelle mesure une variable s'écarte de sa moyenne.
La formule de la variance d'une variable x est :
Var(x)=n1i=1∑n(xi−xˉ)2Covariance mesure comment deux variables évoluent ensemble.
La formule de la covariance entre les variables x et y est :
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matrice de covariance généralise la covariance à plusieurs variables. Pour un ensemble de données X avec d caractéristiques et n échantillons, la matrice de covariance Σ est une matrice d×d où chaque entrée Σij représente la covariance entre la caractéristique i et la caractéristique j, calculée avec le dénominateur n−1 afin d'obtenir un estimateur non biaisé.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Dans le code ci-dessus, les données sont centrées manuellement puis la matrice de covariance est calculée à l'aide de la multiplication matricielle. Cette matrice décrit comment chaque paire de caractéristiques varie ensemble.
Merci pour vos commentaires !