Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Inzicht in Centrale Tendens en Spreiding | Kansrekening & Statistiek
Wiskunde voor Data Science

bookInzicht in Centrale Tendens en Spreiding

Gemiddelde (Average)

Note
Definitie

Het gemiddelde is de som van alle waarden gedeeld door het aantal waarden. Het geeft de "centrale" of "typische" waarde in uw dataset weer.

Formule:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Voorbeeld:
Als uw website 100, 120 en 110 bezoekers had over drie dagen:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretatie:
Gemiddeld ontving de site 110 bezoekers per dag.

Variantie

Note
Definitie

Variantie meet hoe ver elk getal in de set van het gemiddelde afligt. Het geeft een indruk van hoe "verspreid" de data is.

Formule:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Voorbeeld (gebruikmakend van de vorige data):

  • Gemiddelde = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Som = 200

Variantie=200366.67\text{Variantie} = \frac{200}{3} \approx 66.67

Interpretatie:
De gemiddelde kwadratische afstand tot het gemiddelde is ongeveer 66,67.

Standaarddeviatie

Note
Definitie

Standaarddeviatie is de vierkantswortel van de variantie. Hiermee wordt de spreiding teruggebracht naar de oorspronkelijke eenheden van de data.

Formule:

σ=σ2\sigma = \sqrt{\sigma^2}

Voorbeeld:
Als de variantie 66.67 is:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretatie:
Gemiddeld ligt het dagelijkse bezoekersaantal ongeveer 8.16 van het gemiddelde af.

Praktijkvoorbeeld: Analyse van Websiteverkeer

Probleem:
Een data scientist registreert het aantal websitebezoekers over 5 dagen:

120,150,130,170,140120, 150, 130, 170, 140

Stap 1 — Gemiddelde:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Stap 2 — Variantie:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Variantie=484+64+144+784+45=14805=296\text{Variantie} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Stap 3 — Standaardafwijking:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusie:

  • Gemiddelde = 142 bezoekers per dag;
  • Variantie = 296;
  • Standaardafwijking = 17.2.

Het websiteverkeer varieert met ongeveer 17,2 bezoekers ten opzichte van een gemiddelde dag.

question mark

Wat is de relatie tussen variantie en standaardafwijking?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 7

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 1.96

bookInzicht in Centrale Tendens en Spreiding

Veeg om het menu te tonen

Gemiddelde (Average)

Note
Definitie

Het gemiddelde is de som van alle waarden gedeeld door het aantal waarden. Het geeft de "centrale" of "typische" waarde in uw dataset weer.

Formule:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Voorbeeld:
Als uw website 100, 120 en 110 bezoekers had over drie dagen:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretatie:
Gemiddeld ontving de site 110 bezoekers per dag.

Variantie

Note
Definitie

Variantie meet hoe ver elk getal in de set van het gemiddelde afligt. Het geeft een indruk van hoe "verspreid" de data is.

Formule:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Voorbeeld (gebruikmakend van de vorige data):

  • Gemiddelde = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Som = 200

Variantie=200366.67\text{Variantie} = \frac{200}{3} \approx 66.67

Interpretatie:
De gemiddelde kwadratische afstand tot het gemiddelde is ongeveer 66,67.

Standaarddeviatie

Note
Definitie

Standaarddeviatie is de vierkantswortel van de variantie. Hiermee wordt de spreiding teruggebracht naar de oorspronkelijke eenheden van de data.

Formule:

σ=σ2\sigma = \sqrt{\sigma^2}

Voorbeeld:
Als de variantie 66.67 is:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretatie:
Gemiddeld ligt het dagelijkse bezoekersaantal ongeveer 8.16 van het gemiddelde af.

Praktijkvoorbeeld: Analyse van Websiteverkeer

Probleem:
Een data scientist registreert het aantal websitebezoekers over 5 dagen:

120,150,130,170,140120, 150, 130, 170, 140

Stap 1 — Gemiddelde:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Stap 2 — Variantie:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Variantie=484+64+144+784+45=14805=296\text{Variantie} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Stap 3 — Standaardafwijking:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Conclusie:

  • Gemiddelde = 142 bezoekers per dag;
  • Variantie = 296;
  • Standaardafwijking = 17.2.

Het websiteverkeer varieert met ongeveer 17,2 bezoekers ten opzichte van een gemiddelde dag.

question mark

Wat is de relatie tussen variantie en standaardafwijking?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 5. Hoofdstuk 7
some-alt