Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Calculer la Variance avec Python | Variance et Écart Type
Apprendre les Statistiques avec Python
course content

Contenu du cours

Apprendre les Statistiques avec Python

Apprendre les Statistiques avec Python

1. Concepts de Base
2. Moyenne, Médiane et Mode avec Python
3. Variance et Écart Type
4. Covariance contre Corrélation
5. Intervalle de Confiance
6. Tests Statistiques

book
Calculer la Variance avec Python

Calcul du variance avec NumPy

Dans numpy, transmettre la séquence de valeurs (comme une colonne du jeu de données) à la fonction np.var(), par exemple : np.var(df['work_year']).

Calcul du variance avec pandas

Dans pandas, appliquer directement la méthode .var() à la colonne, comme ceci : df['work_year'].var().

Les deux méthodes produisent des résultats similaires, avec de légères différences dues à l'utilisation de dénominateurs différents : N dans numpy (variance de population) et N-1 dans pandas (variance d'échantillon).

123456789101112
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 3

Demandez à l'IA

expand
ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

course content

Contenu du cours

Apprendre les Statistiques avec Python

Apprendre les Statistiques avec Python

1. Concepts de Base
2. Moyenne, Médiane et Mode avec Python
3. Variance et Écart Type
4. Covariance contre Corrélation
5. Intervalle de Confiance
6. Tests Statistiques

book
Calculer la Variance avec Python

Calcul du variance avec NumPy

Dans numpy, transmettre la séquence de valeurs (comme une colonne du jeu de données) à la fonction np.var(), par exemple : np.var(df['work_year']).

Calcul du variance avec pandas

Dans pandas, appliquer directement la méthode .var() à la colonne, comme ceci : df['work_year'].var().

Les deux méthodes produisent des résultats similaires, avec de légères différences dues à l'utilisation de dénominateurs différents : N dans numpy (variance de population) et N-1 dans pandas (variance d'échantillon).

123456789101112
import pandas as pd import numpy as np df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/update/ds_salaries_statistics', index_col = 0) # Calculate the variance using the function from the NumPy library var_1 = np.var(df['salary_in_usd']) # Calculate the variance using the function from the pandas library var_2 = df['salary_in_usd'].var() print('The variace using NumPy library is', var_1) print('The variace using pandas library is', var_2)
copy
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 3
Nous sommes désolés de vous informer que quelque chose s'est mal passé. Qu'est-il arrivé ?
some-alt