Stryg for at vise menuen

Beregning af varians med NumPy

I numpy indsættes rækken af værdier (såsom en kolonne fra datasættet) i funktionen np.var(), for eksempel: np.var(df['work_year']).

Beregning af varians med pandas

I pandas anvendes metoden .var() direkte på kolonnen, sådan her: df['work_year'].var().

Begge metoder giver lignende resultater, med små forskelle på grund af brugen af forskellige nævnere: N i numpy (populationsvarians) og N-1 i pandas (stickprøvevarians).


              123456789101112
            
import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0)

# Calculate the variance using the function from the NumPy library
var_1 = np.var(df['salary_in_usd'])
# Calculate the variance using the function from the pandas library
var_2 = df['salary_in_usd'].var()

print('The variace using NumPy library is', var_1)
print('The variace using pandas library is', var_2)

Var alt klart?

Tak for dine kommentarer!

Sektion 3. Kapitel 3

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Beregn Varians med Python