Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Verständnis von Zentraler Tendenz und Streuung | Wahrscheinlichkeit & Statistik
Mathematik für Data Science

bookVerständnis von Zentraler Tendenz und Streuung

Mittelwert (Durchschnitt)

Note
Definition

Der Mittelwert ist die Summe aller Werte geteilt durch die Anzahl der Werte. Er stellt den „zentralen“ oder „typischen“ Wert in Ihrem Datensatz dar.

Formel:

Mittelwert=xin\text{Mittelwert} = \frac{\sum x_i}{n}

Beispiel:
Wenn Ihre Website an drei Tagen 100, 120 und 110 Besucher hatte:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretation:
Im Durchschnitt erhielt die Seite 110 Besucher pro Tag.

Varianz

Note
Definition

Die Varianz misst, wie weit jede Zahl in der Menge vom Mittelwert entfernt ist. Sie gibt einen Eindruck davon, wie „gestreut“ die Daten sind.

Formel:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Beispiel (unter Verwendung der vorherigen Daten):

  • Mittelwert = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Summe = 200

Varianz=200366.67\text{Varianz} = \frac{200}{3} \approx 66.67

Interpretation:
Der durchschnittliche quadrierte Abstand vom Mittelwert beträgt etwa 66,67.

Standardabweichung

Note
Definition

Die Standardabweichung ist die Quadratwurzel der Varianz. Sie bringt die Streuung zurück auf die ursprünglichen Einheiten der Daten.

Formel:

σ=σ2\sigma = \sqrt{\sigma^2}

Beispiel:
Wenn die Varianz 66.67 beträgt:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretation:
Im Durchschnitt liegt die Besucherzahl pro Tag etwa 8,16 vom Mittelwert entfernt.

Praxisbeispiel: Analyse des Website-Traffics

Problem:
Ein Data Scientist erfasst die Anzahl der Website-Besucher über 5 Tage:

120,150,130,170,140120, 150, 130, 170, 140

Schritt 1 — Mittelwert:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Schritt 2 — Varianz:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varianz=484+64+144+784+45=14805=296\text{Varianz} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Schritt 3 — Standardabweichung:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Fazit:

  • Mittelwert = 142 Besucher pro Tag;
  • Varianz = 296;
  • Standardabweichung = 17,2.

Der Website-Traffic variiert um etwa 17,2 Besucher vom durchschnittlichen Tag.

question mark

Was ist die Beziehung zwischen Varianz und Standardabweichung?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 7

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain why variance is important in data analysis?

How do I interpret standard deviation in real-world scenarios?

Can you provide more examples of calculating mean, variance, and standard deviation?

Awesome!

Completion rate improved to 1.96

bookVerständnis von Zentraler Tendenz und Streuung

Swipe um das Menü anzuzeigen

Mittelwert (Durchschnitt)

Note
Definition

Der Mittelwert ist die Summe aller Werte geteilt durch die Anzahl der Werte. Er stellt den „zentralen“ oder „typischen“ Wert in Ihrem Datensatz dar.

Formel:

Mittelwert=xin\text{Mittelwert} = \frac{\sum x_i}{n}

Beispiel:
Wenn Ihre Website an drei Tagen 100, 120 und 110 Besucher hatte:

100+120+1103=110\frac{100 + 120 + 110}{3} = 110

Interpretation:
Im Durchschnitt erhielt die Seite 110 Besucher pro Tag.

Varianz

Note
Definition

Die Varianz misst, wie weit jede Zahl in der Menge vom Mittelwert entfernt ist. Sie gibt einen Eindruck davon, wie „gestreut“ die Daten sind.

Formel:

σ2=(xiμ)2n\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}

Beispiel (unter Verwendung der vorherigen Daten):

  • Mittelwert = 110;
  • (100110)2=100(100 − 110)^2 = 100;
  • (120110)2=100(120 − 110)^2 = 100;
  • (110110)2=0(110 − 110)^2 = 0.

Summe = 200

Varianz=200366.67\text{Varianz} = \frac{200}{3} \approx 66.67

Interpretation:
Der durchschnittliche quadrierte Abstand vom Mittelwert beträgt etwa 66,67.

Standardabweichung

Note
Definition

Die Standardabweichung ist die Quadratwurzel der Varianz. Sie bringt die Streuung zurück auf die ursprünglichen Einheiten der Daten.

Formel:

σ=σ2\sigma = \sqrt{\sigma^2}

Beispiel:
Wenn die Varianz 66.67 beträgt:

σ=66.678.16\sigma = \sqrt{66.67} \approx 8.16

Interpretation:
Im Durchschnitt liegt die Besucherzahl pro Tag etwa 8,16 vom Mittelwert entfernt.

Praxisbeispiel: Analyse des Website-Traffics

Problem:
Ein Data Scientist erfasst die Anzahl der Website-Besucher über 5 Tage:

120,150,130,170,140120, 150, 130, 170, 140

Schritt 1 — Mittelwert:

120+150+130+170+1405=142\frac{120 + 150 + 130 + 170 + 140}{5} = 142

Schritt 2 — Varianz:

  • (120142)2=484(120 - 142)^2 = 484;
  • (150142)2=64(150 - 142)^2 = 64;
  • (130142)2=144(130 - 142)^2 = 144;
  • (170142)2=784(170 - 142)^2 = 784;
  • (140142)2=4(140 - 142)^2 = 4.
Varianz=484+64+144+784+45=14805=296\text{Varianz} = \frac{484+64+144+784+4}{5} = \frac{1480}{5} = 296

Schritt 3 — Standardabweichung:

σ=29617.2\sigma = \sqrt{296} \approx 17.2

Fazit:

  • Mittelwert = 142 Besucher pro Tag;
  • Varianz = 296;
  • Standardabweichung = 17,2.

Der Website-Traffic variiert um etwa 17,2 Besucher vom durchschnittlichen Tag.

question mark

Was ist die Beziehung zwischen Varianz und Standardabweichung?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 7
some-alt