Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Durchführen Eines t-Tests in Python | Statistisches Testen
Lernen von Statistik mit Python
course content

Kursinhalt

Lernen von Statistik mit Python

Lernen von Statistik mit Python

1. Grundkonzepte
2. Mittelwert, Median und Modus mit Python
3. Varianz und Standardabweichung
4. Kovarianz vs. Korrelation
5. Konfidenzintervall
6. Statistisches Testen

book
Durchführen Eines t-Tests in Python

Um einen t-Test in Python durchzuführen, müssen Sie nur die alternative Hypothese angeben und angeben, ob die Varianzen ungefähr gleich (homogen) sind.

Die Funktion ttest_ind() innerhalb von scipy.stats übernimmt den Rest. Unten ist die Syntax:

Parameter:

  • a — die erste Stichprobe;
  • b — die zweite Stichprobe;
  • equal_var — auf True setzen, wenn die Varianzen ungefähr gleich sind, und False, wenn sie es nicht sind;
  • alternative — die Art der alternativen Hypothese:
    • 'two-sided' — zeigt an, dass die Mittelwerte nicht gleich sind;
    • 'less' — impliziert, dass der erste Mittelwert kleiner als der zweite ist;
    • 'greater' — impliziert, dass der erste Mittelwert größer als der zweite ist.

Rückgabewerte:

  • statistic — der Wert der t-Statistik;
  • pvalue — der p-Wert.

Wir sind am pvalue interessiert. Wenn es niedriger als α (normalerweise 0,05) ist, dann liegt die t-Statistik im kritischen Bereich, sodass wir die alternative Hypothese akzeptieren sollten. Und wenn pvalue größer als α ist — akzeptieren wir die Nullhypothese, dass die Mittelwerte gleich sind.

Hier ist ein Beispiel für die Anwendung des t-Tests auf unseren Höhen-Datensatz:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 6. Kapitel 6
We're sorry to hear that something went wrong. What happened?
some-alt