Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Varianssi, Kovarianssi ja Kovarianssimatriisi | PCA:n Matemaattiset Perusteet
Ulottuvuuksien Vähentäminen PCA:lla

bookVarianssi, Kovarianssi ja Kovarianssimatriisi

Note
Määritelmä

Varianssi mittaa, kuinka paljon muuttuja poikkeaa keskiarvostaan.

Kaavan varianssille muuttujalle xx on:

Var(x)=1ni=1n(xixˉ)2\mathrm{Var}(x) = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
Note
Määritelmä

Kovarianssi mittaa, kuinka kaksi muuttujaa muuttuvat yhdessä.

Kaava muuttujien xx ja yy kovarianssille on:

Cov(x,y)=1n1i=1n(xixˉ)(yiyˉ)\mathrm{Cov}(x, y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})

Kovarianssimatriisi yleistää kovarianssin usealle muuttujalle. Aineistolle XX, jossa on dd ominaisuutta ja nn havaintoa, kovarianssimatriisi Σ\Sigma on d×dd \times d -matriisi, jossa jokainen alkio Σij\Sigma_{ij} on ominaisuuksien ii ja jj välinen kovarianssi. Laskennassa käytetään nimittäjää n1n-1, jotta saadaan harhaton estimaatti.

12345678910111213
import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
copy

Yllä olevassa koodissa aineisto keskitetään manuaalisesti ja kovarianssimatriisi lasketaan matriisikertolaskun avulla. Tämä matriisi kuvaa, miten kukin ominaisuuspari vaihtelee yhdessä.

question mark

Mikä väite kuvaa oikein varianssin, kovarianssin ja kovarianssimatriisin välistä suhdetta?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain why we center the data before computing the covariance matrix?

What is the difference between dividing by n and n-1 in the covariance calculation?

How do I interpret the values in the covariance matrix?

Awesome!

Completion rate improved to 8.33

bookVarianssi, Kovarianssi ja Kovarianssimatriisi

Pyyhkäise näyttääksesi valikon

Note
Määritelmä

Varianssi mittaa, kuinka paljon muuttuja poikkeaa keskiarvostaan.

Kaavan varianssille muuttujalle xx on:

Var(x)=1ni=1n(xixˉ)2\mathrm{Var}(x) = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
Note
Määritelmä

Kovarianssi mittaa, kuinka kaksi muuttujaa muuttuvat yhdessä.

Kaava muuttujien xx ja yy kovarianssille on:

Cov(x,y)=1n1i=1n(xixˉ)(yiyˉ)\mathrm{Cov}(x, y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})

Kovarianssimatriisi yleistää kovarianssin usealle muuttujalle. Aineistolle XX, jossa on dd ominaisuutta ja nn havaintoa, kovarianssimatriisi Σ\Sigma on d×dd \times d -matriisi, jossa jokainen alkio Σij\Sigma_{ij} on ominaisuuksien ii ja jj välinen kovarianssi. Laskennassa käytetään nimittäjää n1n-1, jotta saadaan harhaton estimaatti.

12345678910111213
import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
copy

Yllä olevassa koodissa aineisto keskitetään manuaalisesti ja kovarianssimatriisi lasketaan matriisikertolaskun avulla. Tämä matriisi kuvaa, miten kukin ominaisuuspari vaihtelee yhdessä.

question mark

Mikä väite kuvaa oikein varianssin, kovarianssin ja kovarianssimatriisin välistä suhdetta?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1
some-alt