Kursinhalt
Statistik Lernen mit Python
Statistik Lernen mit Python
Durchführung Eines T-Tests in Python
Um einen t-Test in Python durchzuführen, müssen lediglich die Alternativhypothese angegeben und festgelegt werden, ob die Varianzen ungefähr gleich (homogen) sind.
Die Funktion ttest_ind()
aus scipy.stats
übernimmt den Rest. Nachfolgend die Syntax:
python
Parameter:
a
— die erste Stichprobe;b
— die zweite Stichprobe;equal_var
— aufTrue
setzen, wenn die Varianzen ungefähr gleich sind, und aufFalse
, wenn sie es nicht sind;alternative
— Art der Alternativhypothese:'two-sided'
— zeigt an, dass die Mittelwerte ungleich sind;'less'
— impliziert, dass der erste Mittelwert kleiner als der zweite ist;'greater'
— impliziert, dass der erste Mittelwert größer als der zweite ist.
Rückgabewerte:
statistic
— Wert der t-Statistik;pvalue
— p-Wert.
Der Fokus liegt auf dem p-value
. Ist der p-value
kleiner als α (in der Regel 0,05), fällt die t-Statistik in den kritischen Bereich, was zur Annahme der Alternativhypothese führt. Ist der p-value
größer als α, wird die Nullhypothese angenommen, was darauf hinweist, dass die Mittelwerte gleich sind.
Hier ein Beispiel für die Anwendung des t-Tests auf den Datensatz mit Körpergrößen:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Danke für Ihr Feedback!