Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Covarianza | Covarianza vs Correlación
Aprendiendo Estadística con Python
course content

Contenido del Curso

Aprendiendo Estadística con Python

Aprendiendo Estadística con Python

1. Conceptos Básicos
2. Media, Mediana y Moda con Python
3. Varianza y Desviación Estándar
4. Covarianza vs Correlación
5. Intervalo de Confianza
6. Pruebas Estadísticas

book
Covarianza

Covarianza es una medida de la variabilidad conjunta de dos variables aleatorias.

Las fórmulas para la covarianza muestral y poblacional difieren, pero no se explorarán en detalle aquí. Este capítulo se centra en las covarianzas del siguiente conjunto de datos:

  • Store_ID: the unique id of the store;

  • Store_Area: the area of the store;

  • Items_Available: the number of items that are available in the store;

  • Daily_Customer_Count: the daily number of customers in the store;

  • Store_Sales: the number of sales in the store.

Cálculo de la covarianza con Python

Para calcular la covarianza en Python, utilice la función np.cov() de la biblioteca NumPy. Esta función recibe dos parámetros: las secuencias de datos para las que desea calcular la covarianza.

El resultado se encuentra en el índice [0,1]. Este curso no abordará los otros valores del resultado, consulte el siguiente ejemplo:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Esto indica que los valores se mueven en la misma dirección. Esto tiene sentido porque un área de tienda más grande corresponde a una mayor cantidad de artículos. Una desventaja importante de la covarianza es que el valor puede ser infinito.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 1

Pregunte a AI

expand
ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

course content

Contenido del Curso

Aprendiendo Estadística con Python

Aprendiendo Estadística con Python

1. Conceptos Básicos
2. Media, Mediana y Moda con Python
3. Varianza y Desviación Estándar
4. Covarianza vs Correlación
5. Intervalo de Confianza
6. Pruebas Estadísticas

book
Covarianza

Covarianza es una medida de la variabilidad conjunta de dos variables aleatorias.

Las fórmulas para la covarianza muestral y poblacional difieren, pero no se explorarán en detalle aquí. Este capítulo se centra en las covarianzas del siguiente conjunto de datos:

  • Store_ID: the unique id of the store;

  • Store_Area: the area of the store;

  • Items_Available: the number of items that are available in the store;

  • Daily_Customer_Count: the daily number of customers in the store;

  • Store_Sales: the number of sales in the store.

Cálculo de la covarianza con Python

Para calcular la covarianza en Python, utilice la función np.cov() de la biblioteca NumPy. Esta función recibe dos parámetros: las secuencias de datos para las que desea calcular la covarianza.

El resultado se encuentra en el índice [0,1]. Este curso no abordará los otros valores del resultado, consulte el siguiente ejemplo:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Esto indica que los valores se mueven en la misma dirección. Esto tiene sentido porque un área de tienda más grande corresponde a una mayor cantidad de artículos. Una desventaja importante de la covarianza es que el valor puede ser infinito.

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 1
Lamentamos que algo salió mal. ¿Qué pasó?
some-alt