Implémentation de la Dispersion en Python
Définir l'ensemble de données
Ici, un tableau est attribué à la variable data afin de garantir un ensemble de données cohérent pour tous les calculs.
import numpy as np
# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
Calculer les statistiques de la population
Cette fonction prend le tableau en entrée et retourne la valeur moyenne de tous les éléments, ce qui résume la tendance centrale de l'ensemble de données.
mean_val = np.mean(data) # Mean
variance_val = np.var(data) # Population variance (ddof=0 by default)
std_dev_val = np.std(data) # Population standard deviation
np.mean(data)calcule la moyenne arithmétique ;np.var(data)calcule la variance de la population (divise par n) ;np.std(data)calcule l'écart-type de la population (racine carrée de la variance).
123456789101112import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
Calcul des statistiques d'échantillon
Pour obtenir des estimations non biaisées à partir d'un échantillon, on utilise ddof=1.
Cela applique la correction de Bessel, en divisant la variance par $(n-1)$ au lieu de $n$.
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
np.var(data, ddof=1)- variance de l'échantillon ;np.std(data, ddof=1)- écart type de l'échantillon.
12345678910import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
L'écart type est la racine carrée de la variance, fournissant une mesure de dispersion dans les mêmes unités que les données d'origine, ce qui facilite son interprétation.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain the difference between population and sample statistics again?
Why do we use Bessel's correction (ddof=1) for sample statistics?
How do these statistics help in real business scenarios?
Awesome!
Completion rate improved to 1.96
Implémentation de la Dispersion en Python
Glissez pour afficher le menu
Définir l'ensemble de données
Ici, un tableau est attribué à la variable data afin de garantir un ensemble de données cohérent pour tous les calculs.
import numpy as np
# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
Calculer les statistiques de la population
Cette fonction prend le tableau en entrée et retourne la valeur moyenne de tous les éléments, ce qui résume la tendance centrale de l'ensemble de données.
mean_val = np.mean(data) # Mean
variance_val = np.var(data) # Population variance (ddof=0 by default)
std_dev_val = np.std(data) # Population standard deviation
np.mean(data)calcule la moyenne arithmétique ;np.var(data)calcule la variance de la population (divise par n) ;np.std(data)calcule l'écart-type de la population (racine carrée de la variance).
123456789101112import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
Calcul des statistiques d'échantillon
Pour obtenir des estimations non biaisées à partir d'un échantillon, on utilise ddof=1.
Cela applique la correction de Bessel, en divisant la variance par $(n-1)$ au lieu de $n$.
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
np.var(data, ddof=1)- variance de l'échantillon ;np.std(data, ddof=1)- écart type de l'échantillon.
12345678910import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
L'écart type est la racine carrée de la variance, fournissant une mesure de dispersion dans les mêmes unités que les données d'origine, ce qui facilite son interprétation.
Merci pour vos commentaires !