Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda O Que É Correlação? | Covariância e Correlação
Fundamentos da Teoria das Probabilidades
course content

Conteúdo do Curso

Fundamentos da Teoria das Probabilidades

Fundamentos da Teoria das Probabilidades

1. Conceitos Básicos da Teoria das Probabilidades
2. Probabilidade de Eventos Complexos
3. Distribuições Discretas Comumente Utilizadas
4. Distribuições Contínuas Comumente Utilizadas
5. Covariância e Correlação

book
O Que É Correlação?

Correlação é uma medida estatística que quantifica a relação entre duas variáveis. Ela é determinada como a covariação escalada e, devido a essa escala, podemos determinar a intensidade das dependências além de sua direção.
A correlação varia entre -1 e 1, onde:

  1. Se a correlação é +1, então os valores possuem uma relação linear positiva perfeita. À medida que uma variável aumenta, a outra variável aumenta proporcionalmente;

  2. Se a correlação é -1, então os valores possuem uma relação linear negativa perfeita. À medida que uma variável aumenta, a outra variável diminui proporcionalmente;

  3. Se o coeficiente de correlação está próximo de 0, então não há relação linear entre as variáveis.

Para calcular a correlação, podemos seguir os mesmos passos do cálculo da covariância e usar np.corrcoef(x, y)[0, 1].

123456789101112131415161718192021222324252627
import matplotlib.pyplot as plt import numpy as np # Create a figure with three subplots fig, axes = plt.subplots(1, 3) fig.set_size_inches(10, 5) # Positive linear dependence x = np.random.rand(100) * 10 # Generate random x values y = x + np.random.randn(100) # Generate y values with added noise axes[0].scatter(x, y) # Scatter plot of x and y axes[0].set_title('Correlation is '+ str(round(np.corrcoef(x, y)[0, 1], 3) )) # Set title with correlation coefficient # Negative linear dependence x = np.random.rand(100) * 10 # Generate random x values y = -x + np.random.randn(100) # Generate y values with added noise axes[1].scatter(x, y) # Scatter plot of x and y axes[1].set_title('Correlation is '+ str(round(np.corrcoef(x, y)[0, 1], 3) )) # Set title with correlation coefficient # Independent np.random.seed(0) # Set random seed for reproducibility x = np.random.rand(200) # Generate random x values y = np.random.rand(200) # Generate random y values axes[2].scatter(x, y) # Scatter plot of x and y axes[2].set_title('Correlation is '+ str(round(np.corrcoef(x, y)[0, 1], 3) )) # Set title with correlation coefficient plt.show() # Display the plot
copy

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 2

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

course content

Conteúdo do Curso

Fundamentos da Teoria das Probabilidades

Fundamentos da Teoria das Probabilidades

1. Conceitos Básicos da Teoria das Probabilidades
2. Probabilidade de Eventos Complexos
3. Distribuições Discretas Comumente Utilizadas
4. Distribuições Contínuas Comumente Utilizadas
5. Covariância e Correlação

book
O Que É Correlação?

Correlação é uma medida estatística que quantifica a relação entre duas variáveis. Ela é determinada como a covariação escalada e, devido a essa escala, podemos determinar a intensidade das dependências além de sua direção.
A correlação varia entre -1 e 1, onde:

  1. Se a correlação é +1, então os valores possuem uma relação linear positiva perfeita. À medida que uma variável aumenta, a outra variável aumenta proporcionalmente;

  2. Se a correlação é -1, então os valores possuem uma relação linear negativa perfeita. À medida que uma variável aumenta, a outra variável diminui proporcionalmente;

  3. Se o coeficiente de correlação está próximo de 0, então não há relação linear entre as variáveis.

Para calcular a correlação, podemos seguir os mesmos passos do cálculo da covariância e usar np.corrcoef(x, y)[0, 1].

123456789101112131415161718192021222324252627
import matplotlib.pyplot as plt import numpy as np # Create a figure with three subplots fig, axes = plt.subplots(1, 3) fig.set_size_inches(10, 5) # Positive linear dependence x = np.random.rand(100) * 10 # Generate random x values y = x + np.random.randn(100) # Generate y values with added noise axes[0].scatter(x, y) # Scatter plot of x and y axes[0].set_title('Correlation is '+ str(round(np.corrcoef(x, y)[0, 1], 3) )) # Set title with correlation coefficient # Negative linear dependence x = np.random.rand(100) * 10 # Generate random x values y = -x + np.random.randn(100) # Generate y values with added noise axes[1].scatter(x, y) # Scatter plot of x and y axes[1].set_title('Correlation is '+ str(round(np.corrcoef(x, y)[0, 1], 3) )) # Set title with correlation coefficient # Independent np.random.seed(0) # Set random seed for reproducibility x = np.random.rand(200) # Generate random x values y = np.random.rand(200) # Generate random y values axes[2].scatter(x, y) # Scatter plot of x and y axes[2].set_title('Correlation is '+ str(round(np.corrcoef(x, y)[0, 1], 3) )) # Set title with correlation coefficient plt.show() # Display the plot
copy

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 2
some-alt