Conteúdo do Curso
Aprendendo Estatística com Python
Aprendendo Estatística com Python
Correlação
Correlação é uma medida estatística que quantifica o grau de associação ou relação entre duas variáveis. Em outras palavras, ajuda a entender como duas variáveis tendem a se mover em relação uma à outra.
A correlação fornece uma maneira direta de examinar o resultado. O valor da correlação está dentro do intervalo de [-1, 1]
. Consulte a tabela abaixo:
Correlação com Python
Para calcular a correlação, utilize a função np.corrcoef()
do numpy
, que requer dois parâmetros: as sequências de dados para as quais a correlação será calculada. Veja um exemplo:
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating correlation corr = np.corrcoef(df['Store_Area'], df['Items_Available'])[0,1] print(corr)
Aqui, extraímos o valor no índice [0, 1]
, assim como no caso da covariância. No capítulo anterior, obtivemos o valor 74955.85
, e interpretar o resultado da função de covariação pode ser desafiador. No entanto, neste caso, podemos concluir que os valores estão fortemente relacionados.
Obrigado pelo seu feedback!