Varianssi, Kovarianssi ja Kovarianssimatriisi
Varianssi mittaa, kuinka paljon muuttuja poikkeaa keskiarvostaan.
Kaavan varianssille muuttujalle x on:
Var(x)=n1i=1∑n(xi−xˉ)2Kovarianssi mittaa, kuinka kaksi muuttujaa muuttuvat yhdessä.
Kaava muuttujien x ja y kovarianssille on:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)Kovarianssimatriisi yleistää kovarianssin usealle muuttujalle. Aineistolle X, jossa on d ominaisuutta ja n havaintoa, kovarianssimatriisi Σ on d×d -matriisi, jossa jokainen alkio Σij on ominaisuuksien i ja j välinen kovarianssi. Laskennassa käytetään nimittäjää n−1, jotta saadaan harhaton estimaatti.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Yllä olevassa koodissa aineisto keskitetään manuaalisesti ja kovarianssimatriisi lasketaan matriisikertolaskun avulla. Tämä matriisi kuvaa, miten kukin ominaisuuspari vaihtelee yhdessä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 8.33
Varianssi, Kovarianssi ja Kovarianssimatriisi
Pyyhkäise näyttääksesi valikon
Varianssi mittaa, kuinka paljon muuttuja poikkeaa keskiarvostaan.
Kaavan varianssille muuttujalle x on:
Var(x)=n1i=1∑n(xi−xˉ)2Kovarianssi mittaa, kuinka kaksi muuttujaa muuttuvat yhdessä.
Kaava muuttujien x ja y kovarianssille on:
Cov(x,y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)Kovarianssimatriisi yleistää kovarianssin usealle muuttujalle. Aineistolle X, jossa on d ominaisuutta ja n havaintoa, kovarianssimatriisi Σ on d×d -matriisi, jossa jokainen alkio Σij on ominaisuuksien i ja j välinen kovarianssi. Laskennassa käytetään nimittäjää n−1, jotta saadaan harhaton estimaatti.
12345678910111213import numpy as np # Example data: 3 samples, 2 features X = np.array([[2.5, 2.4], [0.5, 0.7], [2.2, 2.9]]) # Center the data (subtract mean) X_centered = X - np.mean(X, axis=0) # Compute covariance matrix manually cov_matrix = (X_centered.T @ X_centered) / X_centered.shape[0] print("Covariance matrix:\n", cov_matrix)
Yllä olevassa koodissa aineisto keskitetään manuaalisesti ja kovarianssimatriisi lasketaan matriisikertolaskun avulla. Tämä matriisi kuvaa, miten kukin ominaisuuspari vaihtelee yhdessä.
Kiitos palautteestasi!