Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Beregn Varians med Python | Varians og Standardafvigelse
Lær Statistik med Python
course content

Kursusindhold

Lær Statistik med Python

Lær Statistik med Python

1. Grundlæggende Begreber
2. Gennemsnit, Median og Typetal med Python
3. Varians og Standardafvigelse
4. Kovarians vs Korrelation
5. Konfidensinterval
6. Statistisk Testning

book
Beregn Varians med Python

Beregning af varians med NumPy

I numpy indsættes rækken af værdier (såsom en kolonne fra datasættet) i funktionen np.var(), for eksempel: np.var(df['work_year']).

Beregning af varians med pandas

I pandas anvendes metoden .var() direkte på kolonnen, således: df['work_year'].var().

Begge metoder giver lignende resultater, med små forskelle på grund af brugen af forskellige nævnere: N i numpy (populationsvarians) og N-1 i pandas (stikprøvevarians).

123456789101112
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
copy
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 3

Spørg AI

expand
ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

course content

Kursusindhold

Lær Statistik med Python

Lær Statistik med Python

1. Grundlæggende Begreber
2. Gennemsnit, Median og Typetal med Python
3. Varians og Standardafvigelse
4. Kovarians vs Korrelation
5. Konfidensinterval
6. Statistisk Testning

book
Beregn Varians med Python

Beregning af varians med NumPy

I numpy indsættes rækken af værdier (såsom en kolonne fra datasættet) i funktionen np.var(), for eksempel: np.var(df['work_year']).

Beregning af varians med pandas

I pandas anvendes metoden .var() direkte på kolonnen, således: df['work_year'].var().

Begge metoder giver lignende resultater, med små forskelle på grund af brugen af forskellige nævnere: N i numpy (populationsvarians) og N-1 i pandas (stikprøvevarians).

123456789101112
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
copy
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 3
Vi beklager, at noget gik galt. Hvad skete der?
some-alt