Gennemfør en t-test
En virksomhed ønsker at afgøre, om der er en signifikant forskel i produktivitetsniveauet mellem udviklere, der arbejder hjemmefra, og dem, der arbejder på kontoret. Heldigvis ved du allerede, at en t-test kan hjælpe med dette.
Virksomheden har to uafhængige udviklerteams: det ene arbejder eksternt, og det andet arbejder fra kontoret. Du har fået udleveret to filer, 'work_from_home.csv'
og 'work_from_office.csv'
, som indeholder de månedlige opgavetællinger for hver udvikler.
Opgaven er at udføre en t-test. Virksomheden ønsker at vide, om udviklere, der arbejder fra kontoret, er mere produktive end hjemmearbejdende. Hvis det er tilfældet, vil de også tvinge det andet team til at arbejde fra kontoret. Hvis hjemmearbejdende er mere produktive, foretager virksomheden ingen ændringer. Den ønskede alternative hypotese er derfor: "Den gennemsnitlige produktivitet for kontorarbejdere er større end for hjemmearbejdere".
Lad os undersøge, om variansen er den samme:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
Den anden standardafvigelse er dobbelt så stor som den første, så varianserne er forskellige.
Husk funktionen ttest_ind
til at udføre et t-test.
python
Swipe to start coding
- Importér
scipy.stats
med aliasetst
. - Udfør en t-test med følgende opsætning:
- Prøver:
home_workers
,office_workers
; - Alternativ hypotese: office > home;
- Ingen homogenitet af varians.
- Prøver:
Løsning
Tak for dine kommentarer!