Utføre en t-test
Et selskap ønsker å finne ut om det er en signifikant forskjell i produktivitetsnivået mellom utviklere som jobber hjemmefra og de som jobber på kontoret. Heldigvis vet du allerede at en t-test kan hjelpe med dette.
Selskapet har to uavhengige utviklerteam: ett jobber eksternt, og det andre jobber fra kontoret. Du har fått to filer, 'work_from_home.csv'
og 'work_from_office.csv'
, som inneholder månedlige antall fullførte oppgaver for hver utvikler.
Oppgaven er å gjennomføre en t-test. Selskapet ønsker å vite om utviklere som jobber fra kontoret er mer produktive enn de som jobber hjemmefra. Hvis det er tilfelle, vil de også tvinge det andre teamet til å jobbe fra kontoret. Dersom hjemmearbeidere er mer produktive, vil selskapet ikke gjøre noen endringer. Den ønskede alternative hypotesen er derfor: "Gjennomsnittlig produktivitet for kontorarbeidere er høyere enn for hjemmearbeidere".
La oss undersøke om variansene er like:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Den andre standardavviket er dobbelt så stort som det første, så variansene er forskjellige.
Husk funksjonen ttest_ind
for å utføre en t-test.
python
Swipe to start coding
- Importer
scipy.stats
med aliasetst
. - Utfør en t-test med følgende oppsett:
- Utvalg:
home_workers
,office_workers
; - Alternativ hypotese: office > home;
- Ingen homogenitet av varians.
- Utvalg:
Løsning
Takk for tilbakemeldingene dine!