Variance, Covariance et Matrice de Covariance
Variance mesure dans quelle mesure une variable s'écarte de sa moyenne.
La formule de la variance d'une variable x est :
Var(x)=n1i=1∑n(xi−xˉ)2Covariance mesure comment deux variables évoluent ensemble.
La formule de la covariance entre les variables x et y est :
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matrice de covariance généralise la covariance à plusieurs variables. Pour un ensemble de données X avec d caractéristiques et n échantillons, la matrice de covariance Σ est une matrice d×d où chaque entrée Σij représente la covariance entre la caractéristique i et la caractéristique j, calculée avec le dénominateur n−1 afin d'obtenir un estimateur non biaisé.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Dans le code ci-dessus, les données sont centrées manuellement puis la matrice de covariance est calculée à l'aide de la multiplication matricielle. Cette matrice décrit comment chaque paire de caractéristiques varie ensemble.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain why we center the data before computing the covariance matrix?
What is the difference between dividing by n and n-1 in the covariance calculation?
How do I interpret the values in the covariance matrix?
Awesome!
Completion rate improved to 8.33
Variance, Covariance et Matrice de Covariance
Glissez pour afficher le menu
Variance mesure dans quelle mesure une variable s'écarte de sa moyenne.
La formule de la variance d'une variable x est :
Var(x)=n1i=1∑n(xi−xˉ)2Covariance mesure comment deux variables évoluent ensemble.
La formule de la covariance entre les variables x et y est :
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matrice de covariance généralise la covariance à plusieurs variables. Pour un ensemble de données X avec d caractéristiques et n échantillons, la matrice de covariance Σ est une matrice d×d où chaque entrée Σij représente la covariance entre la caractéristique i et la caractéristique j, calculée avec le dénominateur n−1 afin d'obtenir un estimateur non biaisé.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Dans le code ci-dessus, les données sont centrées manuellement puis la matrice de covariance est calculée à l'aide de la multiplication matricielle. Cette matrice décrit comment chaque paire de caractéristiques varie ensemble.
Merci pour vos commentaires !