Summary
This chapter demonstrates how to compute measures of spread—mean, population and sample variance (using ddof=1 for Bessel’s correction), and standard deviation—using NumPy functions, and how to visualize the data distribution with a histogram and overlay lines for mean ± standard deviation.

General domain of usage
Data analysis

## Definiera datasetet

Här tilldelas en array till variabeln `data` för att säkerställa ett konsekvent dataset att använda vid alla beräkningar.

```python
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
```

## Beräkna populationsstatistik

Denna funktion tar arrayen som indata och returnerar medelvärdet av alla element, vilket sammanfattar den centrala tendensen i datasetet.

```python
mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
```

* `np.mean(data)` beräknar det aritmetiska medelvärdet;
* `np.var(data)` beräknar **populationsvariansen** (dividerar med $$n$$);
* `np.std(data)` beräknar **populationsstandardavvikelsen** (kvadratroten av variansen).

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

print(f"Mean: {mean_val}")
print(f"Variance (Population): {variance_val}")
print(f"Standard Deviation (Population): {std_dev_val}")

## Beräkna stickprovsstatistik

För att få **oberoende skattningar** från ett stickprov använder vi `ddof=1`.
Detta tillämpar **Bessels korrigering**, vilket innebär att variansen delas med $(n-1)$ istället för $n$.

```python
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
```

* `np.var(data, ddof=1)` - stickprovsvarians;
* `np.std(data, ddof=1)` - stickprovsstandardavvikelse.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

print(f"Variance (Sample): {sample_variance_val}")
print(f"Standard Deviation (Sample): {sample_std_dev_val}")

Standardavvikelsen är kvadratroten av variansen och ger ett spridningsmått i **samma enheter som de ursprungliga data**, vilket gör det lättare att tolka.

Hur beräknar vi standardavvikelse med `numpy`-biblioteket?

Behärska de matematiska grunderna som är avgörande för data science. Utforska centrala begrepp inom funktioner, analys, linjär algebra, sannolikhet och dimensionsreduktion. Bygg både teoretisk förståelse och praktisk kodningsvana för att stärka din förmåga att analysera data, modellera komplexa system och tillämpa avancerade tekniker inom maskininlärning.

Utforska grunderna för matematiska funktioner. Lär dig olika typer av algebraiska och transcendenta funktioner, deras egenskaper och hur de implementeras i Python för att lösa verkliga problem.

Behärska begreppen mängder och serier, från grundläggande operationer till praktiska tillämpningar. Få praktisk erfarenhet av att implementera mängdoperationer och arbeta med aritmetiska och geometriska serier i Python.

Utveckla en gedigen förståelse för gränsvärden, derivator, integraler och partiella derivator. Knyt samman teori och praktik genom att implementera dessa begrepp i Python och tillämpa dem på optimering med hjälp av gradientnedstigning.

Bygg gedigna kunskaper om vektorer, matriser och transformationer. Lär dig dekompositionsmetoder och egenvärdesanalys, samtidigt som begreppen förstärks med Python-programmeringsutmaningar och praktiska tillämpningar inom data science.

Fördjupa dig i sannolikhetsteori och statistik. Studera betingad sannolikhet, Bayes sats och statistiska mått. Implementera centrala koncept i Python, simulera fördelningar och stärk dina färdigheter genom utmaningar och frågesporter.

Implementering av Spridning i Python

Definiera datasetet

Beräkna populationsstatistik

Beräkna stickprovsstatistik