Kursinnehåll
Lära Sig Statistik med Python
Lära Sig Statistik med Python
Utföra ett t-test i Python
För att utföra ett t-test i Python behöver du endast ange den alternativa hypotesen och ange om varianserna är ungefär lika (homogena).
Funktionen ttest_ind()
i scipy.stats
hanterar resten. Nedan visas syntaxen:
python
Parametrar:
a
— det första urvalet;b
— det andra urvalet;equal_var
— sätt tillTrue
om varianserna är ungefär lika, ochFalse
om de inte är det;alternative
— typ av alternativ hypotes:'two-sided'
— anger att medelvärdena inte är lika;'less'
— innebär att det första medelvärdet är mindre än det andra;'greater'
— innebär att det första medelvärdet är större än det andra.
Returvärden:
statistic
— värdet på t-statistikan;pvalue
— p-värdet.
Fokus ligger på p-value
. Om p-value
är lägre än α (vanligtvis 0,05) hamnar t-statistikan inom det kritiska området, vilket leder till att den alternativa hypotesen accepteras. Om p-value
är större än α accepteras nollhypotesen, vilket indikerar att medelvärdena är lika.
Här är ett exempel på hur t-testet tillämpas på höjddatamängden:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Tack för dina kommentarer!