Conteúdo do Curso
Aprendendo Estatística com Python
Aprendendo Estatística com Python
2. Média, Mediana e Moda com Python
4. Covariância vs Correlação
Calcular Variância com Python
Calculando a Variância com NumPy
No numpy
, passe a sequência de valores (como uma coluna do conjunto de dados) para a função np.var()
, por exemplo: np.var(df['work_year'])
.
Calculando a Variância com pandas
No pandas
, aplique o método .var()
diretamente à coluna, assim: df['work_year'].var()
.
Ambos os métodos produzem resultados semelhantes, com pequenas diferenças devido ao uso de denominadores diferentes: N no numpy
(variância populacional) e N-1 no pandas
(variância amostral).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 3. Capítulo 3