Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Implementering av Spridning i Python | Sannolikhet & Statistik
Matematik för Data Science

bookImplementering av Spridning i Python

Definiera datasetet

Här tilldelas en array till variabeln data för att säkerställa ett konsekvent dataset att använda vid alla beräkningar.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Beräkna populationsstatistik

Denna funktion tar arrayen som indata och returnerar medelvärdet av alla element, vilket sammanfattar den centrala tendensen i datasetet.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) beräknar det aritmetiska medelvärdet;
  • np.var(data) beräknar populationsvariansen (dividerar med nn);
  • np.std(data) beräknar populationsstandardavvikelsen (kvadratroten av variansen).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Beräkna stickprovsstatistik

För att få oberoende skattningar från ett stickprov använder vi ddof=1. Detta tillämpar Bessels korrigering, vilket innebär att variansen delas med $(n-1)$ istället för $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - stickprovsvarians;
  • np.std(data, ddof=1) - stickprovsstandardavvikelse.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Not

Standardavvikelsen är kvadratroten av variansen och ger ett spridningsmått i samma enheter som de ursprungliga data, vilket gör det lättare att tolka.

question mark

Hur beräknar vi standardavvikelse med numpy-biblioteket?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 8

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

bookImplementering av Spridning i Python

Svep för att visa menyn

Definiera datasetet

Här tilldelas en array till variabeln data för att säkerställa ett konsekvent dataset att använda vid alla beräkningar.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Beräkna populationsstatistik

Denna funktion tar arrayen som indata och returnerar medelvärdet av alla element, vilket sammanfattar den centrala tendensen i datasetet.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) beräknar det aritmetiska medelvärdet;
  • np.var(data) beräknar populationsvariansen (dividerar med nn);
  • np.std(data) beräknar populationsstandardavvikelsen (kvadratroten av variansen).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Beräkna stickprovsstatistik

För att få oberoende skattningar från ett stickprov använder vi ddof=1. Detta tillämpar Bessels korrigering, vilket innebär att variansen delas med $(n-1)$ istället för $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - stickprovsvarians;
  • np.std(data, ddof=1) - stickprovsstandardavvikelse.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Not

Standardavvikelsen är kvadratroten av variansen och ger ett spridningsmått i samma enheter som de ursprungliga data, vilket gör det lättare att tolka.

question mark

Hur beräknar vi standardavvikelse med numpy-biblioteket?

Select the correct answer

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 8
some-alt