Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Beregn Varians med Python | Varians og Standardafvigelse
Lær Statistik med Python

bookBeregn Varians med Python

Beregning af varians med NumPy

I numpy indsættes rækken af værdier (såsom en kolonne fra datasættet) i funktionen np.var(), for eksempel: np.var(df['work_year']).

Beregning af varians med pandas

I pandas anvendes metoden .var() direkte på kolonnen, således: df['work_year'].var().

Begge metoder giver lignende resultater, med små forskelle på grund af brugen af forskellige nævnere: N i numpy (populationsvarians) og N-1 i pandas (stikprøvevarians).

123456789101112
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
copy
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 3

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Why do NumPy and pandas give different variance values?

Can you explain the difference between population and sample variance?

How can I make NumPy and pandas return the same variance result?

Awesome!

Completion rate improved to 2.63

bookBeregn Varians med Python

Stryg for at vise menuen

Beregning af varians med NumPy

I numpy indsættes rækken af værdier (såsom en kolonne fra datasættet) i funktionen np.var(), for eksempel: np.var(df['work_year']).

Beregning af varians med pandas

I pandas anvendes metoden .var() direkte på kolonnen, således: df['work_year'].var().

Begge metoder giver lignende resultater, med små forskelle på grund af brugen af forskellige nævnere: N i numpy (populationsvarians) og N-1 i pandas (stikprøvevarians).

123456789101112
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
copy
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 3
some-alt