Kursinnhold
Lære Statistikk med Python
Lære Statistikk med Python
Utføring av t-test i Python
For å utføre en t-test i Python, må du angi den alternative hypotesen og indikere om variansene er omtrent like (homogene).
Funksjonen ttest_ind()
i scipy.stats
håndterer resten. Nedenfor vises syntaksen:
python
Parametere:
a
— det første utvalget;b
— det andre utvalget;equal_var
— sett tilTrue
hvis variansene er omtrent like, ogFalse
hvis de ikke er det;alternative
— typen alternativ hypotese:'two-sided'
— indikerer at gjennomsnittene ikke er like;'less'
— innebærer at det første gjennomsnittet er mindre enn det andre;'greater'
— innebærer at det første gjennomsnittet er større enn det andre.
Returverdier:
statistic
— verdien til t-statistikken;pvalue
— p-verdien.
Fokuset er på p-value
. Hvis p-value
er lavere enn α (vanligvis 0,05), faller t-statistikken innenfor det kritiske området, noe som fører til aksept av den alternative hypotesen. Hvis p-value
er større enn α, aksepteres nullhypotesen, noe som indikerer at gjennomsnittene er like.
Her er et eksempel på bruk av t-testen på høyde-datasettet:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Takk for tilbakemeldingene dine!