Summary
This chapter demonstrates how to compute measures of spread—mean, population and sample variance (using ddof=1 for Bessel’s correction), and standard deviation—using NumPy functions, and how to visualize the data distribution with a histogram and overlay lines for mean ± standard deviation.

General domain of usage
Data analysis

## Définir l'ensemble de données

Ici, un tableau est attribué à la variable `data` afin de garantir un ensemble de données cohérent pour tous les calculs.

```python
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
```

## Calculer les statistiques de la population

Cette fonction prend le tableau en entrée et retourne la valeur moyenne de tous les éléments, ce qui résume la tendance centrale de l'ensemble de données.

```python
mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
```

* `np.mean(data)` calcule la moyenne arithmétique ;
* `np.var(data)` calcule la **variance de la population** (divise par $$n$$) ;
* `np.std(data)` calcule l'**écart-type de la population** (racine carrée de la variance).

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

print(f"Mean: {mean_val}")
print(f"Variance (Population): {variance_val}")
print(f"Standard Deviation (Population): {std_dev_val}")

## Calcul des statistiques d'échantillon

Pour obtenir des **estimations non biaisées** à partir d'un échantillon, on utilise `ddof=1`.
Cela applique la **correction de Bessel**, en divisant la variance par $(n-1)$ au lieu de $n$.

```python
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
```

* `np.var(data, ddof=1)` - variance de l'échantillon ;
* `np.std(data, ddof=1)` - écart type de l'échantillon.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

print(f"Variance (Sample): {sample_variance_val}")
print(f"Standard Deviation (Sample): {sample_std_dev_val}")

L'écart type est la racine carrée de la variance, fournissant une mesure de dispersion dans les **mêmes unités que les données d'origine**, ce qui facilite son interprétation.

Remarque

Comment calcule-t-on l'écart type avec la bibliothèque `numpy` ?

Maîtrisez les bases mathématiques essentielles pour la science des données. Explorez les concepts fondamentaux des fonctions, du calcul différentiel et intégral, de l'algèbre linéaire, de la probabilité et de la réduction de dimensionnalité. Développez à la fois une compréhension théorique et une expérience pratique du codage afin de renforcer votre capacité à analyser des données, modéliser des systèmes complexes et appliquer des techniques avancées en apprentissage automatique.

Explorez les bases des fonctions mathématiques. Découvrez différents types de fonctions algébriques et transcendantes, leurs propriétés, ainsi que leur implémentation en Python pour résoudre des problèmes concrets.

Maîtrise des concepts d'ensembles et de séries, des opérations de base aux applications pratiques. Expérience pratique de la mise en œuvre des opérations sur les ensembles et du travail avec les séries arithmétiques et géométriques en Python.

Acquisition d'une compréhension approfondie des limites, dérivées, intégrales et dérivées partielles. Mise en relation de la théorie et de la pratique par l'implémentation de ces concepts en Python et leur application à l'optimisation via la descente de gradient.

Acquisition de connaissances solides sur les vecteurs, les matrices et les transformations. Étude des méthodes de décomposition et de l'analyse des valeurs propres, avec consolidation des concepts à travers des exercices de programmation Python et des applications pratiques en science des données.

Approfondissement de la théorie des probabilités et des statistiques. Étude de la probabilité conditionnelle, du théorème de Bayes et des mesures statistiques. Mise en œuvre des concepts clés en Python, simulation de distributions et consolidation des compétences par des exercices et des quiz.

Implémentation de la Dispersion en Python

Définir l'ensemble de données

Calculer les statistiques de la population

Calcul des statistiques d'échantillon