Leer Variantie Berekenen met Python | Variantie en Standaarddeviatie

Veeg om het menu te tonen

Variantie berekenen met NumPy

In numpy geef je de reeks waarden (zoals een kolom uit de dataset) door aan de functie np.var(), bijvoorbeeld: np.var(df['work_year']).

Variantie berekenen met pandas

In pandas pas je de methode .var() direct toe op de kolom, zoals: df['work_year'].var().

Beide methoden leveren vergelijkbare resultaten op, met kleine verschillen door het gebruik van verschillende noemers: N in numpy (populatievariantie) en N-1 in pandas (steekproefvariantie).


              123456789101112
            
import pandas as pd
import numpy as np

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0)

# Calculate the variance using the function from the NumPy library
var_1 = np.var(df['salary_in_usd'])
# Calculate the variance using the function from the pandas library
var_2 = df['salary_in_usd'].var()

print('The variace using NumPy library is', var_1)
print('The variace using pandas library is', var_2)

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 3

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 3. Hoofdstuk 3