Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele T-testin Suorittaminen Pythonilla | Tilastollinen Testaaminen
Tilastotieteen Opiskelu Pythonilla
course content

Kurssisisältö

Tilastotieteen Opiskelu Pythonilla

Tilastotieteen Opiskelu Pythonilla

1. Peruskäsitteet
2. Keskiarvo, Mediaani ja Moodi Pythonilla
3. Varianssi ja Keskihajonta
4. Kovarianssi vs. Korrelaatio
5. Luottamusväli
6. Tilastollinen Testaaminen

book
T-testin Suorittaminen Pythonilla

t-testin suorittaminen Pythonissa edellyttää vain vaihtoehtoisen hypoteesin määrittämistä sekä sen ilmoittamista, ovatko varianssit suunnilleen yhtä suuret (homogeeniset).

ttest_ind()-kirjaston scipy.stats-funktio hoitaa loput. Alla on syntaksi:

python

Parametrit:

  • a — ensimmäinen otos;

  • b — toinen otos;

  • equal_var — aseta arvoksi True, jos varianssit ovat suunnilleen yhtä suuret, ja False, jos eivät ole;

  • alternative — vaihtoehtoisen hypoteesin tyyppi:

    • 'two-sided' — tarkoittaa, että keskiarvot eivät ole yhtä suuret;

    • 'less' — tarkoittaa, että ensimmäinen keskiarvo on pienempi kuin toinen;

    • 'greater' — tarkoittaa, että ensimmäinen keskiarvo on suurempi kuin toinen.

Paluuarvot:

  • statistict-testisuureen arvo;

  • pvalue — p-arvo.

Huomio kohdistuu p-value. Jos p-value on pienempi kuin α (yleensä 0,05), t-testisuure osuu kriittiselle alueelle, jolloin vaihtoehtoinen hypoteesi hyväksytään. Jos p-value on suurempi kuin α, nollahypoteesi hyväksytään, mikä osoittaa, että keskiarvot ovat yhtä suuret.

Alla on esimerkki t-testin soveltamisesta pituusaineistoon:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 6

Kysy tekoälyä

expand
ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

course content

Kurssisisältö

Tilastotieteen Opiskelu Pythonilla

Tilastotieteen Opiskelu Pythonilla

1. Peruskäsitteet
2. Keskiarvo, Mediaani ja Moodi Pythonilla
3. Varianssi ja Keskihajonta
4. Kovarianssi vs. Korrelaatio
5. Luottamusväli
6. Tilastollinen Testaaminen

book
T-testin Suorittaminen Pythonilla

t-testin suorittaminen Pythonissa edellyttää vain vaihtoehtoisen hypoteesin määrittämistä sekä sen ilmoittamista, ovatko varianssit suunnilleen yhtä suuret (homogeeniset).

ttest_ind()-kirjaston scipy.stats-funktio hoitaa loput. Alla on syntaksi:

python

Parametrit:

  • a — ensimmäinen otos;

  • b — toinen otos;

  • equal_var — aseta arvoksi True, jos varianssit ovat suunnilleen yhtä suuret, ja False, jos eivät ole;

  • alternative — vaihtoehtoisen hypoteesin tyyppi:

    • 'two-sided' — tarkoittaa, että keskiarvot eivät ole yhtä suuret;

    • 'less' — tarkoittaa, että ensimmäinen keskiarvo on pienempi kuin toinen;

    • 'greater' — tarkoittaa, että ensimmäinen keskiarvo on suurempi kuin toinen.

Paluuarvot:

  • statistict-testisuureen arvo;

  • pvalue — p-arvo.

Huomio kohdistuu p-value. Jos p-value on pienempi kuin α (yleensä 0,05), t-testisuure osuu kriittiselle alueelle, jolloin vaihtoehtoinen hypoteesi hyväksytään. Jos p-value on suurempi kuin α, nollahypoteesi hyväksytään, mikä osoittaa, että keskiarvot ovat yhtä suuret.

Alla on esimerkki t-testin soveltamisesta pituusaineistoon:

123456789101112131415
import pandas as pd import scipy.stats as st # Load the data male = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/male.csv').squeeze() female = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/female.csv').squeeze() # Apply t-test t_stat, pvalue = st.ttest_ind(male, female, equal_var=True, alternative="greater") if pvalue > 0.05: # Check if we should support or not the null hypothesis if pvalue > 0.05: print("We support the null hypothesis, the mean values are equal") else: print("We reject the null hypothesis, males are taller")
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 6
Pahoittelemme, että jotain meni pieleen. Mitä tapahtui?
some-alt