Contenido del Curso
Aprendiendo Estadística con Python
Aprendiendo Estadística con Python
Correlación
Correlación es una medida estadística que cuantifica el grado de asociación o relación entre dos variables. En otras palabras, ayuda a comprender cómo tienden a moverse dos variables en relación entre sí.
La correlación proporciona una forma sencilla de examinar el resultado. El valor de la correlación se encuentra dentro del rango de [-1, 1]
. Consulte la tabla a continuación:
Correlación con Python
Para calcular la correlación, utilice la función np.corrcoef()
de numpy
, que requiere dos parámetros: las secuencias de datos para las cuales se va a calcular la correlación. A continuación se muestra un ejemplo:
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aquí, extrajimos el valor en el índice [0, 1]
, al igual que en el caso de la covarianza. En el capítulo anterior, obtuvimos el valor 74955.85
, y la interpretación del resultado de la función de covariación puede ser compleja. Sin embargo, en este caso, podemos concluir que los valores están fuertemente relacionados.
¡Gracias por tus comentarios!