Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Spreiding Implementeren in Python | Kansrekening & Statistiek
Wiskunde voor Data Science

bookSpreiding Implementeren in Python

Definieer de dataset

Hier wordt een array toegewezen aan de variabele data om te zorgen voor een consistente dataset voor alle berekeningen.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Populatiestatistieken berekenen

Deze functie neemt de array als invoer en retourneert de gemiddelde waarde van alle elementen, wat de centrale tendens van de dataset samenvat.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) berekent het rekenkundig gemiddelde;
  • np.var(data) berekent de populatievariantie (deelt door nn);
  • np.std(data) berekent de populatiestandaardafwijking (wortel uit de variantie).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Steekproefstatistieken berekenen

Voor onbevooroordeelde schattingen uit een steekproef gebruiken we ddof=1. Dit past Bessel's correctie toe, waarbij de variantie wordt gedeeld door $(n-1)$ in plaats van $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - steekproefvariantie;
  • np.std(data, ddof=1) - steekproefstandaardafwijking.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Opmerking

Standaardafwijking is de vierkantswortel van de variantie en geeft een spreidingsmaat in dezelfde eenheden als de oorspronkelijke data, waardoor interpretatie eenvoudiger wordt.

question mark

Hoe berekenen we de standaardafwijking met de numpy-bibliotheek?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 8

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain the difference between population and sample statistics again?

Why do we use Bessel's correction (ddof=1) for sample statistics?

How do these statistics help in real business scenarios?

Awesome!

Completion rate improved to 1.96

bookSpreiding Implementeren in Python

Veeg om het menu te tonen

Definieer de dataset

Hier wordt een array toegewezen aan de variabele data om te zorgen voor een consistente dataset voor alle berekeningen.

import numpy as np

# Create a numpy array of daily sales
data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16])

Populatiestatistieken berekenen

Deze functie neemt de array als invoer en retourneert de gemiddelde waarde van alle elementen, wat de centrale tendens van de dataset samenvat.

mean_val = np.mean(data)       # Mean
variance_val = np.var(data)    # Population variance (ddof=0 by default)
std_dev_val = np.std(data)     # Population standard deviation
  • np.mean(data) berekent het rekenkundig gemiddelde;
  • np.var(data) berekent de populatievariantie (deelt door nn);
  • np.std(data) berekent de populatiestandaardafwijking (wortel uit de variantie).
123456789101112
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) mean_val = np.mean(data) # Mean variance_val = np.var(data) # Population variance (ddof=0 by default) std_dev_val = np.std(data) # Population standard deviation print(f"Mean: {mean_val}") print(f"Variance (Population): {variance_val}") print(f"Standard Deviation (Population): {std_dev_val}")
copy

Steekproefstatistieken berekenen

Voor onbevooroordeelde schattingen uit een steekproef gebruiken we ddof=1. Dit past Bessel's correctie toe, waarbij de variantie wordt gedeeld door $(n-1)$ in plaats van $n$.

sample_variance_val = np.var(data, ddof=1)
sample_std_dev_val = np.std(data, ddof=1)
  • np.var(data, ddof=1) - steekproefvariantie;
  • np.std(data, ddof=1) - steekproefstandaardafwijking.
12345678910
import numpy as np # Create a numpy array of daily sales data = np.array([10, 15, 12, 18, 20, 22, 14, 17, 11, 16]) sample_variance_val = np.var(data, ddof=1) sample_std_dev_val = np.std(data, ddof=1) print(f"Variance (Sample): {sample_variance_val}") print(f"Standard Deviation (Sample): {sample_std_dev_val}")
copy
Note
Opmerking

Standaardafwijking is de vierkantswortel van de variantie en geeft een spreidingsmaat in dezelfde eenheden als de oorspronkelijke data, waardoor interpretatie eenvoudiger wordt.

question mark

Hoe berekenen we de standaardafwijking met de numpy-bibliotheek?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 8
some-alt