Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele T-testin Suorittaminen Pythonilla | Tilastollinen Testaaminen
Tilastotieteen Opiskelu Pythonilla

bookT-testin Suorittaminen Pythonilla

t-testin suorittaminen Pythonissa edellyttää vain vaihtoehtoisen hypoteesin määrittämistä sekä sen ilmoittamista, ovatko varianssit suunnilleen yhtä suuret (homogeeniset).

ttest_ind()-kirjaston scipy.stats-funktio hoitaa loput. Alla on syntaksi:

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')

Parametrit:

  • a — ensimmäinen otos;
  • b — toinen otos;
  • equal_var — aseta arvoksi True, jos varianssit ovat suunnilleen yhtä suuret, ja False, jos eivät ole;
  • alternative — vaihtoehtoisen hypoteesin tyyppi:
    • 'two-sided' — tarkoittaa, että keskiarvot eivät ole yhtä suuret;
    • 'less' — tarkoittaa, että ensimmäinen keskiarvo on pienempi kuin toinen;
    • 'greater' — tarkoittaa, että ensimmäinen keskiarvo on suurempi kuin toinen.

Paluuarvot:

  • statistict-testisuureen arvo;
  • pvalue — p-arvo.

Huomio kohdistuu p-value. Jos p-value on pienempi kuin α (yleensä 0,05), t-testisuure osuu kriittiselle alueelle, jolloin vaihtoehtoinen hypoteesi hyväksytään. Jos p-value on suurempi kuin α, nollahypoteesi hyväksytään, mikä osoittaa, että keskiarvot ovat yhtä suuret.

Alla on esimerkki t-testin soveltamisesta pituusaineistoon:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 6

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 2.63

bookT-testin Suorittaminen Pythonilla

Pyyhkäise näyttääksesi valikon

t-testin suorittaminen Pythonissa edellyttää vain vaihtoehtoisen hypoteesin määrittämistä sekä sen ilmoittamista, ovatko varianssit suunnilleen yhtä suuret (homogeeniset).

ttest_ind()-kirjaston scipy.stats-funktio hoitaa loput. Alla on syntaksi:

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')

Parametrit:

  • a — ensimmäinen otos;
  • b — toinen otos;
  • equal_var — aseta arvoksi True, jos varianssit ovat suunnilleen yhtä suuret, ja False, jos eivät ole;
  • alternative — vaihtoehtoisen hypoteesin tyyppi:
    • 'two-sided' — tarkoittaa, että keskiarvot eivät ole yhtä suuret;
    • 'less' — tarkoittaa, että ensimmäinen keskiarvo on pienempi kuin toinen;
    • 'greater' — tarkoittaa, että ensimmäinen keskiarvo on suurempi kuin toinen.

Paluuarvot:

  • statistict-testisuureen arvo;
  • pvalue — p-arvo.

Huomio kohdistuu p-value. Jos p-value on pienempi kuin α (yleensä 0,05), t-testisuure osuu kriittiselle alueelle, jolloin vaihtoehtoinen hypoteesi hyväksytään. Jos p-value on suurempi kuin α, nollahypoteesi hyväksytään, mikä osoittaa, että keskiarvot ovat yhtä suuret.

Alla on esimerkki t-testin soveltamisesta pituusaineistoon:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 6
some-alt