Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Дисперсія, Коваріація та Матриця Коваріацій | Математичні Основи PCA
Зменшення Розмірності за Допомогою PCA

bookДисперсія, Коваріація та Матриця Коваріацій

Note
Визначення

Дисперсія вимірює, наскільки змінна відхиляється від свого середнього значення.

Формула дисперсії змінної xx:

Var(x)=1ni=1n(xixˉ)2\mathrm{Var}(x) = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
Note
Визначення

Коваріація вимірює, як дві змінні змінюються разом.

Формула коваріації змінних xx та yy має вигляд:

Cov(x,y)=1n1i=1n(xixˉ)(yiyˉ)\mathrm{Cov}(x, y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})

Коваріаційна матриця узагальнює коваріацію для декількох змінних. Для набору даних XX з dd ознаками та nn зразками коваріаційна матриця Σ\Sigma є d×dd \times d матрицею, де кожен елемент Σij\Sigma_{ij} — це коваріація між ознакою ii та ознакою jj, обчислена з дільником n1n-1 для отримання незміщеної оцінки.

12345678910111213
import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
copy

У наведеному вище коді дані спочатку центруються, після чого коваріаційна матриця обчислюється за допомогою матричного множення. Ця матриця відображає, як кожна пара ознак змінюється разом.

question mark

Яке твердження точно описує взаємозв’язок між дисперсією, коваріацією та матрицею коваріацій?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain why we center the data before computing the covariance matrix?

What is the difference between dividing by n and n-1 in the covariance calculation?

How do I interpret the values in the covariance matrix?

Awesome!

Completion rate improved to 8.33

bookДисперсія, Коваріація та Матриця Коваріацій

Свайпніть щоб показати меню

Note
Визначення

Дисперсія вимірює, наскільки змінна відхиляється від свого середнього значення.

Формула дисперсії змінної xx:

Var(x)=1ni=1n(xixˉ)2\mathrm{Var}(x) = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
Note
Визначення

Коваріація вимірює, як дві змінні змінюються разом.

Формула коваріації змінних xx та yy має вигляд:

Cov(x,y)=1n1i=1n(xixˉ)(yiyˉ)\mathrm{Cov}(x, y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})

Коваріаційна матриця узагальнює коваріацію для декількох змінних. Для набору даних XX з dd ознаками та nn зразками коваріаційна матриця Σ\Sigma є d×dd \times d матрицею, де кожен елемент Σij\Sigma_{ij} — це коваріація між ознакою ii та ознакою jj, обчислена з дільником n1n-1 для отримання незміщеної оцінки.

12345678910111213
import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
copy

У наведеному вище коді дані спочатку центруються, після чого коваріаційна матриця обчислюється за допомогою матричного множення. Ця матриця відображає, як кожна пара ознак змінюється разом.

question mark

Яке твердження точно описує взаємозв’язок між дисперсією, коваріацією та матрицею коваріацій?

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
some-alt