Calculer la Variance avec Python
Calcul du variance avec NumPy
Dans numpy, transmettez la séquence de valeurs (comme une colonne du jeu de données) à la fonction np.var(), par exemple : np.var(df['work_year']).
Calcul du variance avec pandas
Dans pandas, appliquez directement la méthode .var() à la colonne, comme ceci : df['work_year'].var().
Les deux méthodes produisent des résultats similaires, avec de légères différences dues à l'utilisation de dénominateurs différents : N dans numpy (variance de population) et N-1 dans pandas (variance d'échantillon).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 2.63
Calculer la Variance avec Python
Glissez pour afficher le menu
Calcul du variance avec NumPy
Dans numpy, transmettez la séquence de valeurs (comme une colonne du jeu de données) à la fonction np.var(), par exemple : np.var(df['work_year']).
Calcul du variance avec pandas
Dans pandas, appliquez directement la méthode .var() à la colonne, comme ceci : df['work_year'].var().
Les deux méthodes produisent des résultats similaires, avec de légères différences dues à l'utilisation de dénominateurs différents : N dans numpy (variance de population) et N-1 dans pandas (variance d'échantillon).
123456789101112import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
Merci pour vos commentaires !