Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Resampling-Ansatz zum Vergleich der Mittelwerte der Datensätze | Testing of Statistical Hypotheses
Fortgeschrittene Wahrscheinlichkeitstheorie
course content

Kursinhalt

Fortgeschrittene Wahrscheinlichkeitstheorie

Fortgeschrittene Wahrscheinlichkeitstheorie

1. Zusätzliche Aussagen Aus Der Wahrscheinlichkeitstheorie
2. Die Grenzwertsätze der Wahrscheinlichkeitstheorie
3. Schätzung von Populationsparametern
4. Testing of Statistical Hypotheses

book
Herausforderung: Resampling-Ansatz zum Vergleich der Mittelwerte der Datensätze

Wir können auch den Resampling-Ansatz verwenden, um die Hypothese mit nicht-Gauss'schen Datensätzen zu testen. Resampling ist eine Technik, um aus einem verfügbaren Datensatz zusätzliche Stichproben zu generieren, von denen jede als repräsentativ für die zugrunde liegende Population angesehen wird.

Ansatzbeschreibung

Lassen Sie uns die einfachste Resampling-Methode beschreiben, um die Haupthypothese zu überprüfen, dass zwei Datensätze X und Y gleiche Mittelwerte haben:

  • Konkatenieren Sie beide Arrays (X und Y) zu einem großen Array;

  • Mischen Sie dieses gesamte Array, sodass Beobachtungen aus jeder Gruppe zufällig in diesem Array verteilt sind, anstatt an der Trennstelle getrennt zu sein;

  • Teilen Sie das Array willkürlich an der Trennstelle (X_length), weisen Sie Beobachtungen unterhalb des Index len(X_length) Gruppe A zu und den Rest Gruppe B;

  • Subtrahieren Sie den Mittelwert dieser neuen Gruppe A vom Mittelwert der neuen Gruppe B. Dies würde uns eine Permutationsteststatistik geben;

  • Wiederholen Sie diese Schritte N Mal, um die Verteilung der Haupthypothese zu simulieren;

  • Berechnen Sie Teststatistiken auf den ursprünglichen Sets X und Y;

  • Bestimmen Sie kritische Werte der Haupthypothesenverteilung;

  • Überprüfen Sie, ob die auf den ursprünglichen Sets berechnete Teststatistik in einen kritischen Bereich der Haupthypothesenverteilung fällt. Wenn dies der Fall ist, lehnen Sie die Haupthypothese ab.

Lassen Sie uns diesen Ansatz im Code anwenden:

Aufgabe

Swipe to start coding

Ihre Aufgabe ist es, den oben beschriebenen Resampling-Algorithmus zu implementieren und die entsprechende Hypothese auf zwei Datensätzen zu überprüfen:

  1. Verwenden Sie die Methode np.concatenate(), um die Arrays X und Y zu verbinden.
  2. Verwenden Sie die Methode .shuffle() des Moduls np.random, um die Daten im zusammengeführten Array zu mischen.
  3. Verwenden Sie die Methode np.quantile(), um den linken kritischen Wert zu berechnen.
  4. Verwenden Sie die erstellte Funktion resampling_test(), um die Hypothese auf generierten Daten zu überprüfen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 5
toggle bottom row

book
Herausforderung: Resampling-Ansatz zum Vergleich der Mittelwerte der Datensätze

Wir können auch den Resampling-Ansatz verwenden, um die Hypothese mit nicht-Gauss'schen Datensätzen zu testen. Resampling ist eine Technik, um aus einem verfügbaren Datensatz zusätzliche Stichproben zu generieren, von denen jede als repräsentativ für die zugrunde liegende Population angesehen wird.

Ansatzbeschreibung

Lassen Sie uns die einfachste Resampling-Methode beschreiben, um die Haupthypothese zu überprüfen, dass zwei Datensätze X und Y gleiche Mittelwerte haben:

  • Konkatenieren Sie beide Arrays (X und Y) zu einem großen Array;

  • Mischen Sie dieses gesamte Array, sodass Beobachtungen aus jeder Gruppe zufällig in diesem Array verteilt sind, anstatt an der Trennstelle getrennt zu sein;

  • Teilen Sie das Array willkürlich an der Trennstelle (X_length), weisen Sie Beobachtungen unterhalb des Index len(X_length) Gruppe A zu und den Rest Gruppe B;

  • Subtrahieren Sie den Mittelwert dieser neuen Gruppe A vom Mittelwert der neuen Gruppe B. Dies würde uns eine Permutationsteststatistik geben;

  • Wiederholen Sie diese Schritte N Mal, um die Verteilung der Haupthypothese zu simulieren;

  • Berechnen Sie Teststatistiken auf den ursprünglichen Sets X und Y;

  • Bestimmen Sie kritische Werte der Haupthypothesenverteilung;

  • Überprüfen Sie, ob die auf den ursprünglichen Sets berechnete Teststatistik in einen kritischen Bereich der Haupthypothesenverteilung fällt. Wenn dies der Fall ist, lehnen Sie die Haupthypothese ab.

Lassen Sie uns diesen Ansatz im Code anwenden:

Aufgabe

Swipe to start coding

Ihre Aufgabe ist es, den oben beschriebenen Resampling-Algorithmus zu implementieren und die entsprechende Hypothese auf zwei Datensätzen zu überprüfen:

  1. Verwenden Sie die Methode np.concatenate(), um die Arrays X und Y zu verbinden.
  2. Verwenden Sie die Methode .shuffle() des Moduls np.random, um die Daten im zusammengeführten Array zu mischen.
  3. Verwenden Sie die Methode np.quantile(), um den linken kritischen Wert zu berechnen.
  4. Verwenden Sie die erstellte Funktion resampling_test(), um die Hypothese auf generierten Daten zu überprüfen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 5
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
We're sorry to hear that something went wrong. What happened?
some-alt