Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Forståelse af Centraltendens og Spredning | Sandsynlighed & Statistik
Matematik for Datavidenskab

bookForståelse af Centraltendens og Spredning

Gennemsnit (Middelværdi)

Note
Definition

Gennemsnittet er summen af alle værdier divideret med antallet af værdier. Det repræsenterer den "centrale" eller "typiske" værdi i dit datasæt.

Formel:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Example:
If your website had 100, 120, and 110 visitors over three days:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Fortolkning:
I gennemsnit modtog siden 110 besøgende pr. dag.

Varians

Note
Definition

Varians måler, hvor langt hvert tal i datasættet er fra gennemsnittet. Det giver en fornemmelse af, hvor "spredt" dataene er.

Formel:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Eksempel (ved brug af de tidligere data):

  • Mean = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Sum = 200

Variance=200366.67\text{Variance} = \frac{200}{3} \approx 66.67

Fortolkning:
Den gennemsnitlige kvadrerede afstand fra gennemsnittet er cirka 66,67.

Standardafvigelse

Note
Definition

Standardafvigelse er kvadratroden af variansen. Den bringer spredningen tilbage til de oprindelige enheder for dataene.

Formel:

σ=σ2\sigma = \sqrt{\sigma^2}

Eksempel:
Hvis variansen er 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Fortolkning:
I gennemsnit ligger hver dags besøgstal cirka 8.16 fra gennemsnittet.

Virkelighedsnært problem: Analyse af webtrafik

Problem:
En data scientist registrerer antallet af besøgende på en hjemmeside over 5 dage:

120,150,130,170,140120, 150, 130, 170, 140

Trin 1 — Gennemsnit:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Trin 2 — Varians:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varians=484+64+144+784+45=14805=296\text{Varians} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Trin 3 — Standardafvigelse:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Konklusion:

  • Gennemsnit = 142 besøgende pr. dag;
  • Varians = 296;
  • Standardafvigelse = 17.2.

Webtrafikken varierer med cirka 17,2 besøgende fra gennemsnittet pr. dag.

question mark

Hvad er forholdet mellem varians og standardafvigelse?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 7

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain why variance is important in data analysis?

How do I interpret standard deviation in real-world scenarios?

Can you provide more examples of calculating mean, variance, and standard deviation?

Awesome!

Completion rate improved to 1.96

bookForståelse af Centraltendens og Spredning

Stryg for at vise menuen

Gennemsnit (Middelværdi)

Note
Definition

Gennemsnittet er summen af alle værdier divideret med antallet af værdier. Det repræsenterer den "centrale" eller "typiske" værdi i dit datasæt.

Formel:

Mean=xin\text{Mean} = \frac{\sum x_i}{n}

Example:
If your website had 100, 120, and 110 visitors over three days:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Fortolkning:
I gennemsnit modtog siden 110 besøgende pr. dag.

Varians

Note
Definition

Varians måler, hvor langt hvert tal i datasættet er fra gennemsnittet. Det giver en fornemmelse af, hvor "spredt" dataene er.

Formel:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Eksempel (ved brug af de tidligere data):

  • Mean = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Sum = 200

Variance=200366.67\text{Variance} = \frac{200}{3} \approx 66.67

Fortolkning:
Den gennemsnitlige kvadrerede afstand fra gennemsnittet er cirka 66,67.

Standardafvigelse

Note
Definition

Standardafvigelse er kvadratroden af variansen. Den bringer spredningen tilbage til de oprindelige enheder for dataene.

Formel:

σ=σ2\sigma = \sqrt{\sigma^2}

Eksempel:
Hvis variansen er 66.67:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Fortolkning:
I gennemsnit ligger hver dags besøgstal cirka 8.16 fra gennemsnittet.

Virkelighedsnært problem: Analyse af webtrafik

Problem:
En data scientist registrerer antallet af besøgende på en hjemmeside over 5 dage:

120,150,130,170,140120, 150, 130, 170, 140

Trin 1 — Gennemsnit:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Trin 2 — Varians:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varians=484+64+144+784+45=14805=296\text{Varians} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Trin 3 — Standardafvigelse:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Konklusion:

  • Gennemsnit = 142 besøgende pr. dag;
  • Varians = 296;
  • Standardafvigelse = 17.2.

Webtrafikken varierer med cirka 17,2 besøgende fra gennemsnittet pr. dag.

question mark

Hvad er forholdet mellem varians og standardafvigelse?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 5. Kapitel 7
some-alt