Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Suorita t-testi | Tilastollinen Testaaminen
Tilastotiede Pythonilla

bookSuorita t-testi

Yritys haluaa selvittää, onko kehittäjien tuottavuudessa merkittävää eroa etätyön ja toimistotyön välillä. Onneksi tiedät jo, että t-testi voi auttaa tässä.

Yrityksellä on kaksi toisistaan riippumatonta kehittäjätiimiä: toinen työskentelee etänä ja toinen toimistolla. Sinulle on toimitettu kaksi tiedostoa, 'work_from_home.csv' ja 'work_from_office.csv', jotka sisältävät kunkin kehittäjän kuukausittaiset tehtävien suoritusmäärät.

Tehtävänä on suorittaa t-testi. Yritys haluaa tietää, ovatko toimistolla työskentelevät kehittäjät tuottavampia kuin etätyöntekijät. Jos näin on, myös toinen tiimi määrätään työskentelemään toimistolla. Mikäli etätyöntekijät ovat tuottavampia, yritys ei tee muutoksia. Haluttu vaihtoehtoinen hypoteesi on: "Toimistotyöntekijöiden keskimääräinen tuottavuus on suurempi kuin etätyöntekijöiden".

Tarkistetaan, ovatko varianssit samat:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Toinen keskihajonta on kaksinkertainen ensimmäiseen verrattuna, joten varianssit eroavat toisistaan. Muista käyttää funktiota ttest_ind t-testin suorittamiseen.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Tehtävä

Swipe to start coding

  1. Tuo scipy.stats käyttäen aliasta st.
  2. Suorita t-testi seuraavalla asetuksella:
    • Otokset: home_workers, office_workers;
    • Vaihtoehtoinen hypoteesi: office > home;
    • Ei varianssien homogeenisuutta.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 7
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you show me how to perform the t-test with unequal variances?

What should the parameters be for the t-test given our alternative hypothesis?

What does the result of the t-test mean for the company's decision?

close

Awesome!

Completion rate improved to 2.63

bookSuorita t-testi

Pyyhkäise näyttääksesi valikon

Yritys haluaa selvittää, onko kehittäjien tuottavuudessa merkittävää eroa etätyön ja toimistotyön välillä. Onneksi tiedät jo, että t-testi voi auttaa tässä.

Yrityksellä on kaksi toisistaan riippumatonta kehittäjätiimiä: toinen työskentelee etänä ja toinen toimistolla. Sinulle on toimitettu kaksi tiedostoa, 'work_from_home.csv' ja 'work_from_office.csv', jotka sisältävät kunkin kehittäjän kuukausittaiset tehtävien suoritusmäärät.

Tehtävänä on suorittaa t-testi. Yritys haluaa tietää, ovatko toimistolla työskentelevät kehittäjät tuottavampia kuin etätyöntekijät. Jos näin on, myös toinen tiimi määrätään työskentelemään toimistolla. Mikäli etätyöntekijät ovat tuottavampia, yritys ei tee muutoksia. Haluttu vaihtoehtoinen hypoteesi on: "Toimistotyöntekijöiden keskimääräinen tuottavuus on suurempi kuin etätyöntekijöiden".

Tarkistetaan, ovatko varianssit samat:

1234567
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
copy

Toinen keskihajonta on kaksinkertainen ensimmäiseen verrattuna, joten varianssit eroavat toisistaan. Muista käyttää funktiota ttest_ind t-testin suorittamiseen.

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Tehtävä

Swipe to start coding

  1. Tuo scipy.stats käyttäen aliasta st.
  2. Suorita t-testi seuraavalla asetuksella:
    • Otokset: home_workers, office_workers;
    • Vaihtoehtoinen hypoteesi: office > home;
    • Ei varianssien homogeenisuutta.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 6. Luku 7
single

single

some-alt