Дисперсія, Коваріація та Матриця Коваріацій
Дисперсія вимірює, наскільки змінна відхиляється від свого середнього значення.
Формула дисперсії змінної x:
Var(x)=n1i=1∑n(xi−xˉ)2Коваріація вимірює, як дві змінні змінюються разом.
Формула коваріації змінних x та y має вигляд:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)Коваріаційна матриця узагальнює коваріацію для декількох змінних. Для набору даних X з d ознаками та n зразками коваріаційна матриця Σ є d×d матрицею, де кожен елемент Σij — це коваріація між ознакою i та ознакою j, обчислена з дільником n−1 для отримання незміщеної оцінки.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
У наведеному вище коді дані спочатку центруються, після чого коваріаційна матриця обчислюється за допомогою матричного множення. Ця матриця відображає, як кожна пара ознак змінюється разом.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain why we center the data before computing the covariance matrix?
What is the difference between dividing by n and n-1 in the covariance calculation?
How do I interpret the values in the covariance matrix?
Awesome!
Completion rate improved to 8.33
Дисперсія, Коваріація та Матриця Коваріацій
Свайпніть щоб показати меню
Дисперсія вимірює, наскільки змінна відхиляється від свого середнього значення.
Формула дисперсії змінної x:
Var(x)=n1i=1∑n(xi−xˉ)2Коваріація вимірює, як дві змінні змінюються разом.
Формула коваріації змінних x та y має вигляд:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)Коваріаційна матриця узагальнює коваріацію для декількох змінних. Для набору даних X з d ознаками та n зразками коваріаційна матриця Σ є d×d матрицею, де кожен елемент Σij — це коваріація між ознакою i та ознакою j, обчислена з дільником n−1 для отримання незміщеної оцінки.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
У наведеному вище коді дані спочатку центруються, після чого коваріаційна матриця обчислюється за допомогою матричного множення. Ця матриця відображає, як кожна пара ознак змінюється разом.
Дякуємо за ваш відгук!