Calculer la Variance avec Python
Calcul du variance avec NumPy
Dans numpy
, transmettre la séquence de valeurs (comme une colonne du jeu de données) à la fonction np.var()
, par exemple : np.var(df['work_year'])
.
Calcul du variance avec pandas
Dans pandas
, appliquer directement la méthode .var()
à la colonne, comme ceci : df['work_year'].var()
.
Les deux méthodes produisent des résultats similaires, avec de légères différences dues à l'utilisation de dénominateurs différents : N dans numpy
(variance de population) et N-1 dans pandas
(variance d'échantillon).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 2.63
Calculer la Variance avec Python
Glissez pour afficher le menu
Calcul du variance avec NumPy
Dans numpy
, transmettre la séquence de valeurs (comme une colonne du jeu de données) à la fonction np.var()
, par exemple : np.var(df['work_year'])
.
Calcul du variance avec pandas
Dans pandas
, appliquer directement la méthode .var()
à la colonne, comme ceci : df['work_year'].var()
.
Les deux méthodes produisent des résultats similaires, avec de légères différences dues à l'utilisation de dénominateurs différents : N dans numpy
(variance de population) et N-1 dans pandas
(variance d'échantillon).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Merci pour vos commentaires !