Correlación
Correlación es una medida estadística que cuantifica el grado de asociación o relación entre dos variables. En otras palabras, ayuda a comprender cómo tienden a moverse dos variables en relación entre sí.
La correlación proporciona una forma sencilla de examinar el resultado. El valor de la correlación se encuentra dentro del rango de [-1, 1]
. Consulte la tabla a continuación:
Correlación con Python
Para calcular la correlación, utilice la función np.corrcoef()
de numpy
, que requiere dos parámetros: las secuencias de datos para las cuales se va a calcular la correlación. A continuación se muestra un ejemplo:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aquí, extrajimos el valor en el índice [0, 1]
, al igual que en el caso de la covarianza. En el capítulo anterior, obtuvimos el valor 74955.85
, y la interpretación del resultado de la función de covariación puede ser compleja. Sin embargo, en este caso, podemos concluir que los valores están fuertemente relacionados.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 2.63
Correlación
Desliza para mostrar el menú
Correlación es una medida estadística que cuantifica el grado de asociación o relación entre dos variables. En otras palabras, ayuda a comprender cómo tienden a moverse dos variables en relación entre sí.
La correlación proporciona una forma sencilla de examinar el resultado. El valor de la correlación se encuentra dentro del rango de [-1, 1]
. Consulte la tabla a continuación:
Correlación con Python
Para calcular la correlación, utilice la función np.corrcoef()
de numpy
, que requiere dos parámetros: las secuencias de datos para las cuales se va a calcular la correlación. A continuación se muestra un ejemplo:
123456789import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aquí, extrajimos el valor en el índice [0, 1]
, al igual que en el caso de la covarianza. En el capítulo anterior, obtuvimos el valor 74955.85
, y la interpretación del resultado de la función de covariación puede ser compleja. Sin embargo, en este caso, podemos concluir que los valores están fuertemente relacionados.
¡Gracias por tus comentarios!