Cursusinhoud
Statistiek Leren Met Python
Statistiek Leren Met Python
2. Gemiddelde, Mediaan en Modus met Python
4. Covariantie Versus Correlatie
Variantie Berekenen met Python
Variantie berekenen met NumPy
In numpy
geef je de reeks waarden (zoals een kolom uit de dataset) door aan de functie np.var()
, bijvoorbeeld: np.var(df['work_year'])
.
Variantie berekenen met pandas
In pandas
pas je de methode .var()
direct toe op de kolom, zoals: df['work_year'].var()
.
Beide methoden leveren vergelijkbare resultaten op, met kleine verschillen door het gebruik van verschillende noemers: N in numpy
(populatievariantie) en N-1 in pandas
(steekproefvariantie).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 3. Hoofdstuk 3