Covarianza

Covarianza es una medida de la variabilidad conjunta de dos variables aleatorias.

Las fórmulas para la covarianza muestral y poblacional difieren, pero no se explorarán en detalle aquí. Este capítulo se centra en las covarianzas del siguiente conjunto de datos:

Store_ID: the unique id of the store;
Store_Area: the area of the store;
Items_Available: the number of items that are available in the store;
Daily_Customer_Count: the daily number of customers in the store;
Store_Sales: the number of sales in the store.

Cálculo de la covarianza con Python

Para calcular la covarianza en Python, utilice la función np.cov() de la biblioteca NumPy. Esta función recibe dos parámetros: las secuencias de datos para las que desea calcular la covarianza.

El resultado se encuentra en el índice [0,1]. Este curso no abordará los otros valores del resultado, consulte el siguiente ejemplo:


              123456789
            
import pandas as pd 
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv')

# Calculating covariance 
cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1]

print(round(cov, 2))

Esto indica que los valores se mueven en la misma dirección. Esto tiene sentido porque un área de tienda más grande corresponde a una mayor cantidad de artículos. Una desventaja importante de la covarianza es que el valor puede ser infinito.

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 4. Capítulo 1

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Contenido del Curso

Aprendiendo Estadística con Python

1. Conceptos Básicos

Muestra vs Población Tipos de Estadística Tipos de Datos Valor Medio Valor Mediano Valor Mediano de un Número Par de Valores Media o Mediana Valor Modal Cuestionario de Estadística Descriptiva

2. Media, Mediana y Moda con Python

Examinar el Conjunto de Datos Cálculo de Valores de Media y Mediana con Python Estadísticas con Pandas Calcular la Media y la Mediana Salarial

3. Varianza y Desviación Estándar

Varianza Poblacional Varianza Muestral Calcular la Varianza con Python Desviación Estándar Desviación Estándar con Python Cálculo de la Varianza y la Desviación Estándar

4. Covarianza vs Correlación

Covarianza Correlación Cuestionario de Covarianza y Correlación Calcular Covarianza y Correlación

5. Intervalo de Confianza

6. Pruebas Estadísticas

Qué es la Prueba t Hipótesis T-test Matemáticamente Prueba Unilateral y Prueba Bilateral Supuestos del T-Test Realización de una Prueba t en Python Realizar una Prueba T T de Student Pareada