Contenu du cours
Apprendre les Statistiques avec Python
Apprendre les Statistiques avec Python
2. Moyenne, Médiane et Mode avec Python
4. Covariance contre Corrélation
Calculer la Variance avec Python
Calcul du variance avec NumPy
Dans numpy
, transmettre la séquence de valeurs (comme une colonne du jeu de données) à la fonction np.var()
, par exemple : np.var(df['work_year'])
.
Calcul du variance avec pandas
Dans pandas
, appliquer directement la méthode .var()
à la colonne, comme ceci : df['work_year'].var()
.
Les deux méthodes produisent des résultats similaires, avec de légères différences dues à l'utilisation de dénominateurs différents : N dans numpy
(variance de population) et N-1 dans pandas
(variance d'échantillon).
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Tout était clair ?
Merci pour vos commentaires !
Section 3. Chapitre 3