Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Implementering av Spredning i Python | Sannsynlighet og Statistikk
Matematikk for Datavitenskap

bookImplementering av Spredning i Python

Definer datasettet

Her tildeles en array til variabelen data for å sikre et konsistent datasett til alle beregninger.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Beregn populasjonsstatistikk

Denne funksjonen tar arrayen som input og returnerer gjennomsnittsverdien av alle elementene, som oppsummerer datasettets sentrale tendens.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) beregner det aritmetiske gjennomsnittet;
  • np.var(data) beregner populasjonsvariansen (deler på nn);
  • np.std(data) beregner populasjonsstandardavviket (kvadratroten av variansen).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Beregn utvalgsstatistikk

For å få upartiske estimater fra et utvalg, bruker vi ddof=1. Dette anvender Bessels korreksjon, som innebærer at variansen deles på $(n-1)$ i stedet for $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) – utvalgsvarians;
  • np.std(data, ddof=1) – utvalgets standardavvik.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Merk

Standardavvik er kvadratroten av variansen, og gir et mål på spredning i samme enheter som de opprinnelige dataene, noe som gjør det lettere å tolke.

question mark

Hvordan beregner vi standardavvik med numpy-biblioteket?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 8

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Awesome!

Completion rate improved to 1.96

bookImplementering av Spredning i Python

Sveip for å vise menyen

Definer datasettet

Her tildeles en array til variabelen data for å sikre et konsistent datasett til alle beregninger.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Beregn populasjonsstatistikk

Denne funksjonen tar arrayen som input og returnerer gjennomsnittsverdien av alle elementene, som oppsummerer datasettets sentrale tendens.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) beregner det aritmetiske gjennomsnittet;
  • np.var(data) beregner populasjonsvariansen (deler på nn);
  • np.std(data) beregner populasjonsstandardavviket (kvadratroten av variansen).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Beregn utvalgsstatistikk

For å få upartiske estimater fra et utvalg, bruker vi ddof=1. Dette anvender Bessels korreksjon, som innebærer at variansen deles på $(n-1)$ i stedet for $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) – utvalgsvarians;
  • np.std(data, ddof=1) – utvalgets standardavvik.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Merk

Standardavvik er kvadratroten av variansen, og gir et mål på spredning i samme enheter som de opprinnelige dataene, noe som gjør det lettere å tolke.

question mark

Hvordan beregner vi standardavvik med numpy-biblioteket?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 8
some-alt