Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Covariância | Covariância vs Correlação
Aprendendo Estatística com Python

bookCovariância

Note
Definição

Covariância é uma medida da variabilidade conjunta de duas variáveis aleatórias.

As fórmulas para amostra e população de covariância diferem, mas não serão exploradas em detalhes aqui. Este capítulo foca nas covariâncias do seguinte conjunto de dados:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Calculando a Covariância com Python

Para calcular a covariância em Python, utilize a função np.cov() da biblioteca NumPy. Ela recebe dois parâmetros: as sequências de dados para as quais se deseja calcular a covariância.

O resultado está localizado no índice [0,1]. Este curso não abordará os outros valores do resultado, consulte o exemplo:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Isso indica que os valores variam na mesma direção. Isso é esperado, pois uma área de loja maior corresponde a um número maior de itens. Uma desvantagem significativa da covariância é que o valor pode ser infinito.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain what the other values in the np.cov() output mean?

How do I interpret the sign and magnitude of the covariance value?

Can you show how to calculate covariance for other pairs of columns in the dataset?

Awesome!

Completion rate improved to 2.63

bookCovariância

Deslize para mostrar o menu

Note
Definição

Covariância é uma medida da variabilidade conjunta de duas variáveis aleatórias.

As fórmulas para amostra e população de covariância diferem, mas não serão exploradas em detalhes aqui. Este capítulo foca nas covariâncias do seguinte conjunto de dados:

  • Store_ID: the unique id of the store;
  • Store_Area: the area of the store;
  • Items_Available: the number of items that are available in the store;
  • Daily_Customer_Count: the daily number of customers in the store;
  • Store_Sales: the number of sales in the store.

Calculando a Covariância com Python

Para calcular a covariância em Python, utilize a função np.cov() da biblioteca NumPy. Ela recebe dois parâmetros: as sequências de dados para as quais se deseja calcular a covariância.

O resultado está localizado no índice [0,1]. Este curso não abordará os outros valores do resultado, consulte o exemplo:

123456789
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/Stores.csv') # Calculating covariance cov = np.cov(df['Store_Area'], df['Items_Available'])[0,1] print(round(cov, 2))
copy

Isso indica que os valores variam na mesma direção. Isso é esperado, pois uma área de loja maior corresponde a um número maior de itens. Uma desvantagem significativa da covariância é que o valor pode ser infinito.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 1
some-alt