Varianza, Covarianza e Matrice di Covarianza
Varianza misura quanto una variabile si discosta dalla sua media.
La formula per la varianza di una variabile x è:
Var(x)=n1i=1∑n(xi−xˉ)2Covarianza misura come due variabili variano insieme.
La formula per la covarianza delle variabili x e y è:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matrice di covarianza generalizza la covarianza a più variabili. Per un dataset X con d caratteristiche e n campioni, la matrice di covarianza Σ è una matrice d×d in cui ogni elemento Σij rappresenta la covarianza tra la caratteristica i e la caratteristica j, calcolata con il denominatore n−1 per ottenere uno stimatore non distorto.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Nel codice sopra, i dati vengono centrati manualmente e la matrice di covarianza viene calcolata tramite moltiplicazione matriciale. Questa matrice descrive come ogni coppia di caratteristiche varia insieme.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain why we center the data before computing the covariance matrix?
What is the difference between dividing by n and n-1 in the covariance calculation?
How do I interpret the values in the covariance matrix?
Awesome!
Completion rate improved to 8.33
Varianza, Covarianza e Matrice di Covarianza
Scorri per mostrare il menu
Varianza misura quanto una variabile si discosta dalla sua media.
La formula per la varianza di una variabile x è:
Var(x)=n1i=1∑n(xi−xˉ)2Covarianza misura come due variabili variano insieme.
La formula per la covarianza delle variabili x e y è:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)La matrice di covarianza generalizza la covarianza a più variabili. Per un dataset X con d caratteristiche e n campioni, la matrice di covarianza Σ è una matrice d×d in cui ogni elemento Σij rappresenta la covarianza tra la caratteristica i e la caratteristica j, calcolata con il denominatore n−1 per ottenere uno stimatore non distorto.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Nel codice sopra, i dati vengono centrati manualmente e la matrice di covarianza viene calcolata tramite moltiplicazione matriciale. Questa matrice descrive come ogni coppia di caratteristiche varia insieme.
Grazie per i tuoi commenti!