Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Implémentation de la Dispersion en Python | Probabilité et Statistiques
Mathématiques pour la Science des Données

bookImplémentation de la Dispersion en Python

Définir l'ensemble de données

Ici, un tableau est attribué à la variable data afin de garantir un ensemble de données cohérent pour tous les calculs.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Calculer les statistiques de la population

Cette fonction prend le tableau en entrée et retourne la valeur moyenne de tous les éléments, ce qui résume la tendance centrale de l'ensemble de données.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) calcule la moyenne arithmétique ;
  • np.var(data) calcule la variance de la population (divise par nn) ;
  • np.std(data) calcule l'écart-type de la population (racine carrée de la variance).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Calcul des statistiques d'échantillon

Pour obtenir des estimations non biaisées à partir d'un échantillon, on utilise ddof=1. Cela applique la correction de Bessel, en divisant la variance par $(n-1)$ au lieu de $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - variance de l'échantillon ;
  • np.std(data, ddof=1) - écart type de l'échantillon.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Remarque

L'écart type est la racine carrée de la variance, fournissant une mesure de dispersion dans les mêmes unités que les données d'origine, ce qui facilite son interprétation.

question mark

Comment calcule-t-on l'écart type avec la bibliothèque numpy ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 8

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain the difference between population and sample statistics again?

Why do we use Bessel's correction (ddof=1) for sample statistics?

How do these statistics help in real business scenarios?

Awesome!

Completion rate improved to 1.96

bookImplémentation de la Dispersion en Python

Glissez pour afficher le menu

Définir l'ensemble de données

Ici, un tableau est attribué à la variable data afin de garantir un ensemble de données cohérent pour tous les calculs.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Calculer les statistiques de la population

Cette fonction prend le tableau en entrée et retourne la valeur moyenne de tous les éléments, ce qui résume la tendance centrale de l'ensemble de données.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) calcule la moyenne arithmétique ;
  • np.var(data) calcule la variance de la population (divise par nn) ;
  • np.std(data) calcule l'écart-type de la population (racine carrée de la variance).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Calcul des statistiques d'échantillon

Pour obtenir des estimations non biaisées à partir d'un échantillon, on utilise ddof=1. Cela applique la correction de Bessel, en divisant la variance par $(n-1)$ au lieu de $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - variance de l'échantillon ;
  • np.std(data, ddof=1) - écart type de l'échantillon.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Remarque

L'écart type est la racine carrée de la variance, fournissant une mesure de dispersion dans les mêmes unités que les données d'origine, ce qui facilite son interprétation.

question mark

Comment calcule-t-on l'écart type avec la bibliothèque numpy ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 8
some-alt