Kurssisisältö
Tilastotieteen Opiskelu Pythonilla
Tilastotieteen Opiskelu Pythonilla
T-testin Suorittaminen Pythonilla
t-testin suorittaminen Pythonissa edellyttää vain vaihtoehtoisen hypoteesin määrittämistä sekä sen ilmoittamista, ovatko varianssit suunnilleen yhtä suuret (homogeeniset).
ttest_ind()
-kirjaston scipy.stats
-funktio hoitaa loput. Alla on syntaksi:
python
Parametrit:
a
— ensimmäinen otos;b
— toinen otos;equal_var
— aseta arvoksiTrue
, jos varianssit ovat suunnilleen yhtä suuret, jaFalse
, jos eivät ole;alternative
— vaihtoehtoisen hypoteesin tyyppi:'two-sided'
— tarkoittaa, että keskiarvot eivät ole yhtä suuret;'less'
— tarkoittaa, että ensimmäinen keskiarvo on pienempi kuin toinen;'greater'
— tarkoittaa, että ensimmäinen keskiarvo on suurempi kuin toinen.
Paluuarvot:
statistic
— t-testisuureen arvo;pvalue
— p-arvo.
Huomio kohdistuu p-value
. Jos p-value
on pienempi kuin α (yleensä 0,05), t-testisuure osuu kriittiselle alueelle, jolloin vaihtoehtoinen hypoteesi hyväksytään. Jos p-value
on suurempi kuin α, nollahypoteesi hyväksytään, mikä osoittaa, että keskiarvot ovat yhtä suuret.
Alla on esimerkki t-testin soveltamisesta pituusaineistoon:
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
Kiitos palautteestasi!