Kursinnhold
Lære Statistikk med Python
Lære Statistikk med Python
2. Gjennomsnitt, Median og Modus med Python
4. Kovarians vs. Korrelasjon
Beregn Varians med Python
Beregning av varians med NumPy
I numpy
sender du sekvensen av verdier (for eksempel en kolonne fra datasettet) inn i funksjonen np.var()
, for eksempel: np.var(df['work_year'])
.
Beregning av varians med pandas
I pandas
bruker du metoden .var()
direkte på kolonnen, slik: df['work_year'].var()
.
Begge metodene gir lignende resultater, med små forskjeller på grunn av bruk av ulike nevner: N i numpy
(populasjonsvarians) og N-1 i pandas
(utvalgsvarians).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 3