Een t-toets Uitvoeren
Een bedrijf wil bepalen of er een significant verschil is in het productiviteitsniveau van ontwikkelaars die thuiswerken versus degenen die op kantoor werken. Gelukkig weet je al dat een t-test hierbij kan helpen.
Het bedrijf heeft twee onafhankelijke ontwikkelteams: één werkt op afstand en het andere werkt vanuit het kantoor. Je hebt twee bestanden ontvangen, 'work_from_home.csv'
en 'work_from_office.csv'
, die het maandelijkse aantal voltooide taken per ontwikkelaar bevatten.
De opdracht is om een t-test uit te voeren. Het bedrijf wil weten of ontwikkelaars die op kantoor werken productiever zijn dan thuiswerkers. Indien dit het geval is, zal het bedrijf het tweede team ook verplichten op kantoor te werken. Als thuiswerkers productiever blijken, zal het bedrijf geen wijzigingen doorvoeren. De gewenste alternatieve hypothese is dus: "Het gemiddelde productiviteitsniveau van kantoormedewerkers is hoger dan dat van thuiswerkers".
Laten we controleren of de varianties gelijk zijn:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
De tweede standaardafwijking is twee keer zo groot als de eerste, dus de varianties verschillen.
Herinner de functie ttest_ind
om een t-toets uit te voeren.
python
Swipe to start coding
- Importeer
scipy.stats
met het aliasst
. - Voer een t-toets uit met de volgende opzet:
- Steekproeven:
home_workers
,office_workers
; - Alternatieve hypothese: office > home;
- Geen homogeniteit van varianties.
- Steekproeven:
Oplossing
Bedankt voor je feedback!