Summary
This chapter demonstrates how to compute measures of spread—mean, population and sample variance (using ddof=1 for Bessel’s correction), and standard deviation—using NumPy functions, and how to visualize the data distribution with a histogram and overlay lines for mean ± standard deviation.

General domain of usage
Data analysis

## Definir el conjunto de datos

Aquí, se asigna un arreglo a la variable `data` para asegurar que se dispone de un conjunto de datos consistente para todas las operaciones de cálculo.

```python
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
```

## Calcular estadísticas poblacionales

Esta función toma el arreglo como entrada y devuelve el valor promedio de todos los elementos, lo que resume la tendencia central del conjunto de datos.

```python
mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
```

* `np.mean(data)` calcula la media aritmética (promedio);
* `np.var(data)` calcula la **varianza poblacional** (divide por $$n$$);
* `np.std(data)` calcula la **desviación estándar poblacional** (raíz cuadrada de la varianza).

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

print(f"Mean: {mean_val}")
print(f"Variance (Population): {variance_val}")
print(f"Standard Deviation (Population): {std_dev_val}")

## Calcular estadísticas muestrales

Para obtener **estimaciones insesgadas** de una muestra, utilizamos `ddof=1`.
Esto aplica la **corrección de Bessel**, dividiendo la varianza por $(n-1)$ en lugar de $n$.

```python
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
```

* `np.var(data, ddof=1)` - varianza muestral;
* `np.std(data, ddof=1)` - desviación estándar muestral.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

print(f"Variance (Sample): {sample_variance_val}")
print(f"Standard Deviation (Sample): {sample_std_dev_val}")

La desviación estándar es la raíz cuadrada de la varianza, proporcionando una medida de dispersión en **las mismas unidades que los datos originales**, lo que facilita su interpretación.

Nota

¿Cómo calculamos la desviación estándar con la biblioteca `numpy`?

Domina los fundamentos matemáticos esenciales para la ciencia de datos. Explora conceptos clave en funciones, cálculo, álgebra lineal, probabilidad y reducción de dimensionalidad. Desarrolla tanto la comprensión teórica como la experiencia práctica en programación para fortalecer tu capacidad de analizar datos, modelar sistemas complejos y aplicar técnicas avanzadas en aprendizaje automático.

Explora los fundamentos de las funciones matemáticas. Estudia los diferentes tipos de funciones algebraicas y trascendentales, sus propiedades y cómo implementarlas en Python para resolver problemas del mundo real.

Domina los conceptos de conjuntos y series, desde operaciones básicas hasta aplicaciones prácticas. Adquiere experiencia práctica implementando operaciones con conjuntos y trabajando con series aritméticas y geométricas en Python.

Desarrollar una comprensión sólida de límites, derivadas, integrales y derivadas parciales. Conectar la teoría con la práctica implementando estos conceptos en Python y aplicándolos a la optimización mediante descenso por gradiente.

Desarrolla un conocimiento sólido de vectores, matrices y transformaciones. Aprende métodos de descomposición y análisis de valores propios, reforzando los conceptos con desafíos de codificación en Python y aplicaciones prácticas en ciencia de datos.

Explora la teoría de la probabilidad y la estadística. Estudia la probabilidad condicional, el teorema de Bayes y las medidas estadísticas. Implementa conceptos clave en Python, simula distribuciones y refuerza tus habilidades mediante desafíos y cuestionarios.

Implementación de la Dispersión en Python

Definir el conjunto de datos

Calcular estadísticas poblacionales

Calcular estadísticas muestrales