¿Qué es la Covarianza?
**La covarianza es una medida numérica que cuantifica la relación entre dos variables. Mide cómo los cambios en una variable se corresponden con los cambios en otra variable. Más concretamente, la covarianza mide la variabilidad conjunta de dos variables y proporciona información sobre la dirección (positiva o negativa) de esta variabilidad.
Para calcular la covarianza entre dos valores tenemos que:
- Realizar el primer experimento estocástico varias veces y escribir los resultados de cada experimento en el array. Será el array
x
. - Realizar el segundo experimento estocástico varias veces y escribir los resultados en el array
y
. - Calcula la covarianza utilizando la librería
numpy
: covarianza = np.cov(x, y)[0, 1]`. Veamos el ejemplo:
Vemos que a medida que aumenta el valor de x
, aumenta también el valor de y
. La correlación es, por tanto, positiva. Hagamos otro experimento:
Ahora bien, mientras que el valor x
aumenta, el valor y
disminuye y la covarianza es negativa. Veamos ahora la covariación entre los resultados de dos experimentos independientes:
Como resultado, podemos llegar a una conclusión:
- Si la covarianza entre dos valores es positiva, entonces al aumentar el primer valor también aumenta el segundo.
- Si la covarianza entre dos valores es negativa entonces con el aumento del primer valor el segundo valor disminuye.
- Si los valores son independientes, entonces tienen una correlación cero (están descorrelacionados).
Presta atención al último punto: la correlación es cero si los valores son independientes. Pero lo contrario no es cierto: si la correlación es cero, esto no significa independencia. Fíjate en el ejemplo:
Los puntos del ejemplo anterior se encuentran dentro del círculo unitario y, por tanto, son dependientes pero no están correlacionados.
En general, sólo las relaciones lineales entre valores pueden identificarse bien con ayuda de la covarianza. Así, en el caso de valores no correlacionados, podemos concluir que no tienen dependencias lineales, sino que pueden tener otros tipos de dependencias más complejas.
¿Todo estuvo claro?
Contenido del Curso
Probability Theory Basics
5. Covarianza y Correlación
Probability Theory Basics
¿Qué es la Covarianza?
**La covarianza es una medida numérica que cuantifica la relación entre dos variables. Mide cómo los cambios en una variable se corresponden con los cambios en otra variable. Más concretamente, la covarianza mide la variabilidad conjunta de dos variables y proporciona información sobre la dirección (positiva o negativa) de esta variabilidad.
Para calcular la covarianza entre dos valores tenemos que:
- Realizar el primer experimento estocástico varias veces y escribir los resultados de cada experimento en el array. Será el array
x
. - Realizar el segundo experimento estocástico varias veces y escribir los resultados en el array
y
. - Calcula la covarianza utilizando la librería
numpy
: covarianza = np.cov(x, y)[0, 1]`. Veamos el ejemplo:
Vemos que a medida que aumenta el valor de x
, aumenta también el valor de y
. La correlación es, por tanto, positiva. Hagamos otro experimento:
Ahora bien, mientras que el valor x
aumenta, el valor y
disminuye y la covarianza es negativa. Veamos ahora la covariación entre los resultados de dos experimentos independientes:
Como resultado, podemos llegar a una conclusión:
- Si la covarianza entre dos valores es positiva, entonces al aumentar el primer valor también aumenta el segundo.
- Si la covarianza entre dos valores es negativa entonces con el aumento del primer valor el segundo valor disminuye.
- Si los valores son independientes, entonces tienen una correlación cero (están descorrelacionados).
Presta atención al último punto: la correlación es cero si los valores son independientes. Pero lo contrario no es cierto: si la correlación es cero, esto no significa independencia. Fíjate en el ejemplo:
Los puntos del ejemplo anterior se encuentran dentro del círculo unitario y, por tanto, son dependientes pero no están correlacionados.
En general, sólo las relaciones lineales entre valores pueden identificarse bien con ayuda de la covarianza. Así, en el caso de valores no correlacionados, podemos concluir que no tienen dependencias lineales, sino que pueden tener otros tipos de dependencias más complejas.
¿Todo estuvo claro?