Suorita t-testi
Yritys haluaa selvittää, onko etätyötä tekevien kehittäjien ja toimistolla työskentelevien kehittäjien tuottavuustasoissa merkittävää eroa. Onneksi tiedät jo, että t-testi voi auttaa tässä.
Yrityksellä on kaksi toisistaan riippumatonta kehittäjätiimiä: toinen työskentelee etänä ja toinen toimistolla. Sinulle on toimitettu kaksi tiedostoa, 'work_from_home.csv'
ja 'work_from_office.csv'
, jotka sisältävät kunkin kehittäjän kuukausittaiset tehtävien suoritusmäärät.
Tehtävänä on suorittaa t-testi. Yritys haluaa tietää, ovatko toimistolla työskentelevät kehittäjät tuottavampia kuin etätyöntekijät. Jos näin on, yritys aikoo määrätä myös toisen tiimin työskentelemään toimistolla. Mikäli etätyöntekijät ovat tuottavampia, yritys ei tee muutoksia. Haluttu vaihtoehtoinen hypoteesi on: "Toimistotyöntekijöiden keskimääräinen tuottavuus on suurempi kuin etätyöntekijöiden".
Tarkistetaan, ovatko varianssit samat:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Toinen keskihajonta on kaksinkertainen ensimmäiseen verrattuna, joten varianssit eroavat toisistaan.
Muista funktio ttest_ind
t-testin suorittamiseen.
python
Swipe to start coding
- Tuo
scipy.stats
käyttäen aliastast
. - Suorita t-testi seuraavalla asetuksella:
- Otokset:
home_workers
,office_workers
; - Vaihtoehtoinen hypoteesi: office > home;
- Ei varianssien homogeenisuutta.
- Otokset:
Ratkaisu
Kiitos palautteestasi!