Kursinnehåll
Lära Sig Statistik med Python
Lära Sig Statistik med Python
2. Medelvärde, Median och Typvärde med Python
4. Kovarians vs Korrelation
Beräkna Varians med Python
Beräkning av varians med NumPy
I numpy
, skicka in sekvensen av värden (till exempel en kolumn från datasettet) i funktionen np.var()
, till exempel: np.var(df['work_year'])
.
Beräkning av varians med pandas
I pandas
, använd metoden .var()
direkt på kolumnen, så här: df['work_year'].var()
.
Båda metoderna ger liknande resultat, med små skillnader på grund av användningen av olika nämnare: N i numpy
(populationsvarians) och N-1 i pandas
(stickprovsvarians).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 3