Ambos os métodos produzem resultados semelhantes, com pequenas diferenças devido ao uso de denominadores diferentes: N no numpy (variância populacional) e N-1 no pandas (variância amostral).


              123456789101112
            
import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0)

# Calculate the variance using the function from the NumPy library
var_1 = np.var(df['salary_in_usd'])
# Calculate the variance using the function from the pandas library
var_2 = df['salary_in_usd'].var()

print('The variace using NumPy library is', var_1)
print('The variace using pandas library is', var_2)

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 3. Capítulo 3

Pergunte à IA

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Conteúdo do Curso

Aprendendo Estatística com Python

1. Conceitos Básicos

Amostra vs População Tipos de Estatística Tipos de Dados Valor Médio Valor Mediano Valor Mediano de um Número Par de Valores Média ou Mediana Valor da Moda Quiz de Estatística Descritiva

2. Média, Mediana e Moda com Python

Examinar o Conjunto de Dados Calculando Valores de Média e Mediana com Python Estatísticas com Pandas Calcular a Média e a Mediana Salarial

3. Variância e Desvio Padrão

Variância Populacional Variância Amostral Calcular Variância com Python Desvio Padrão Desvio Padrão com Python Calculando Variância e Desvio Padrão

4. Covariância vs Correlação

Covariância Correlação Quiz de Covariância e Correlação Calcular Covariância e Correlação

5. Intervalo de Confiança

6. Testes Estatísticos

O Que É o Teste t Hipóteses T-Test Matematicamente Teste Unilateral e Teste Bilateral Pressupostos do Teste t Realização de um Teste t em Python Realizar um Teste T Teste T Pareado

Calcular Variância com Python

Calculando a Variância com NumPy

No numpy, passe a sequência de valores (como uma coluna do conjunto de dados) para a função np.var(), por exemplo: np.var(df['work_year']).

Calculando a Variância com pandas

No pandas, aplique o método .var() diretamente à coluna, assim: df['work_year'].var().


              123456789101112
            
import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0)

# Calculate the variance using the function from the NumPy library
var_1 = np.var(df['salary_in_usd'])
# Calculate the variance using the function from the pandas library
var_2 = df['salary_in_usd'].var()

print('The variace using NumPy library is', var_1)
print('The variace using pandas library is', var_2)

Tudo estava claro?

Obrigado pelo seu feedback!

Seção 3. Capítulo 3