Summary
This chapter demonstrates how to compute measures of spread—mean, population and sample variance (using ddof=1 for Bessel’s correction), and standard deviation—using NumPy functions, and how to visualize the data distribution with a histogram and overlay lines for mean ± standard deviation.

General domain of usage
Data analysis

## Definer datasettet

Her tildeles en array til variabelen `data` for å sikre et konsistent datasett til alle beregninger.

```python
import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])
```

## Beregn populasjonsstatistikk

Denne funksjonen tar arrayen som input og returnerer gjennomsnittsverdien av alle elementene, som oppsummerer datasettets sentrale tendens.

```python
mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
```

* `np.mean(data)` beregner det aritmetiske gjennomsnittet;
* `np.var(data)` beregner **populasjonsvariansen** (deler på $$n$$);
* `np.std(data)` beregner **populasjonsstandardavviket** (kvadratroten av variansen).

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation

print(f"Mean: {mean_val}")
print(f"Variance (Population): {variance_val}")
print(f"Standard Deviation (Population): {std_dev_val}")

## Beregn utvalgsstatistikk

For å få **upartiske estimater** fra et utvalg, bruker vi `ddof=1`.
Dette anvender **Bessels korreksjon**, som innebærer at variansen deles på $(n-1)$ i stedet for $n$.

```python
sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
```

* `np.var(data, ddof=1)` – utvalgsvarians;
* `np.std(data, ddof=1)` – utvalgets standardavvik.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)

print(f"Variance (Sample): {sample_variance_val}")
print(f"Standard Deviation (Sample): {sample_std_dev_val}")

Standardavvik er kvadratroten av variansen, og gir et mål på spredning i **samme enheter som de opprinnelige dataene**, noe som gjør det lettere å tolke.

Merk

Hvordan beregner vi standardavvik med `numpy`-biblioteket?

Behersk de matematiske grunnprinsippene som er essensielle for datavitenskap. Utforsk kjernebegreper innen funksjoner, kalkulus, lineær algebra, sannsynlighet og dimensjonsreduksjon. Bygg både teoretisk forståelse og praktisk programmeringserfaring for å styrke evnen til å analysere data, modellere komplekse systemer og anvende avanserte teknikker innen maskinlæring.

Utforsk grunnlaget for matematiske funksjoner. Lær om ulike typer algebraiske og transcendentale funksjoner, deres egenskaper, og hvordan de kan implementeres i Python for å løse reelle problemer.

Behersk konseptene mengder og rekker, fra grunnleggende operasjoner til praktiske anvendelser. Få praktisk erfaring med å implementere mengdeoperasjoner og arbeide med aritmetiske og geometriske rekker i Python.

Utvikle en solid forståelse av grenser, deriverte, integraler og partiellderiverte. Knytt teori til praksis ved å implementere disse konseptene i Python og anvende dem på optimering gjennom gradient descent.

Bygg solid kunnskap om vektorer, matriser og transformasjoner. Lær dekomponeringsmetoder og egenverdianalyse, samtidig som konseptene styrkes med Python-kodeutfordringer og praktiske anvendelser innen datavitenskap.

Fordyp deg i sannsynlighetsteori og statistikk. Studer betinget sannsynlighet, Bayes’ teorem og statistiske mål. Implementer sentrale konsepter i Python, simuler fordelinger, og styrk ferdighetene dine gjennom utfordringer og quizer.

Implementering av Spredning i Python

Definer datasettet

Beregn populasjonsstatistikk

Beregn utvalgsstatistikk