Eseguire un Test T
Un'azienda desidera determinare se esiste una differenza significativa nei livelli di produttività degli sviluppatori che lavorano da casa rispetto a quelli che lavorano in ufficio. Fortunatamente, sai già che un t-test può aiutare in questo.
L'azienda dispone di due team di sviluppatori indipendenti: uno lavora da remoto e l'altro lavora dall'ufficio. Ti sono stati forniti due file, 'work_from_home.csv'
e 'work_from_office.csv'
, che contengono il numero mensile di task completati da ciascun sviluppatore.
Il compito è eseguire un t-test. L'azienda vuole sapere se gli sviluppatori che lavorano in ufficio sono più produttivi rispetto a quelli che lavorano da casa. In tal caso, costringerà anche il secondo team a lavorare dall'ufficio. Se invece i lavoratori da casa risultano più produttivi, l'azienda non apporterà modifiche. Quindi l'ipotesi alternativa desiderata è "La produttività media dei lavoratori in ufficio è superiore a quella dei lavoratori da casa".
Verifichiamo se le varianze sono uguali:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
La seconda deviazione standard è il doppio della prima, quindi le varianze sono diverse.
Ricorda la funzione ttest_ind
per eseguire un t-test.
python
Swipe to start coding
- Importare
scipy.stats
utilizzando l'aliasst
. - Eseguire un t-test con la seguente configurazione:
- Campioni:
home_workers
,office_workers
; - Ipotesi alternativa: office > home;
- Nessuna omogeneità delle varianze.
- Campioni:
Soluzione
Grazie per i tuoi commenti!