Beräkna Varians med Python
Svep för att visa menyn
Beräkning av varians med NumPy
I numpy, skicka in sekvensen av värden (till exempel en kolumn från datasettet) till funktionen np.var(), exempelvis: np.var(df['work_year']).
Beräkning av varians med pandas
I pandas, använd metoden .var() direkt på kolumnen, så här: df['work_year'].var().
Båda metoderna ger liknande resultat, med små skillnader på grund av användningen av olika nämnare: N i numpy (populationsvarians) och N-1 i pandas (stickprovsvarians).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 3
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Avsnitt 3. Kapitel 3