Varianssi, Kovarianssi ja Kovarianssimatriisi
Varianssi mittaa, kuinka paljon muuttuja poikkeaa keskiarvostaan.
Kaavan varianssille muuttujalle x on:
Var(x)=n1i=1∑n(xi−xˉ)2Kovarianssi mittaa, kuinka kaksi muuttujaa muuttuvat yhdessä.
Kaava muuttujien x ja y kovarianssille on:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)Kovarianssimatriisi yleistää kovarianssin usealle muuttujalle. Aineistolle X, jossa on d ominaisuutta ja n havaintoa, kovarianssimatriisi Σ on d×d -matriisi, jossa jokainen alkio Σij on ominaisuuksien i ja j välinen kovarianssi. Laskennassa käytetään nimittäjää n−1, jotta saadaan harhaton estimaatti.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Yllä olevassa koodissa aineisto keskitetään manuaalisesti ja kovarianssimatriisi lasketaan matriisikertolaskun avulla. Tämä matriisi kuvaa, miten kukin ominaisuuspari vaihtelee yhdessä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain why we center the data before computing the covariance matrix?
What is the difference between dividing by n and n-1 in the covariance calculation?
How do I interpret the values in the covariance matrix?
Awesome!
Completion rate improved to 8.33
Varianssi, Kovarianssi ja Kovarianssimatriisi
Pyyhkäise näyttääksesi valikon
Varianssi mittaa, kuinka paljon muuttuja poikkeaa keskiarvostaan.
Kaavan varianssille muuttujalle x on:
Var(x)=n1i=1∑n(xi−xˉ)2Kovarianssi mittaa, kuinka kaksi muuttujaa muuttuvat yhdessä.
Kaava muuttujien x ja y kovarianssille on:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)Kovarianssimatriisi yleistää kovarianssin usealle muuttujalle. Aineistolle X, jossa on d ominaisuutta ja n havaintoa, kovarianssimatriisi Σ on d×d -matriisi, jossa jokainen alkio Σij on ominaisuuksien i ja j välinen kovarianssi. Laskennassa käytetään nimittäjää n−1, jotta saadaan harhaton estimaatti.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Yllä olevassa koodissa aineisto keskitetään manuaalisesti ja kovarianssimatriisi lasketaan matriisikertolaskun avulla. Tämä matriisi kuvaa, miten kukin ominaisuuspari vaihtelee yhdessä.
Kiitos palautteestasi!