Eseguire un t-test
Un'azienda desidera determinare se esiste una differenza significativa nei livelli di produttività degli sviluppatori che lavorano da casa rispetto a quelli che lavorano in ufficio. Fortunatamente, sai già che un t-test può essere utile a questo scopo.
L'azienda dispone di due team di sviluppatori indipendenti: uno lavora da remoto e l'altro lavora in ufficio. Ti sono stati forniti due file, 'work_from_home.csv' e 'work_from_office.csv', che contengono il numero mensile di attività completate da ciascun sviluppatore.
Il compito è condurre un t-test. L'azienda vuole sapere se gli sviluppatori che lavorano in ufficio sono più produttivi rispetto a quelli che lavorano da casa. In tal caso, costringerà anche il secondo team a lavorare in ufficio. Se invece i lavoratori da casa risultano più produttivi, l'azienda non apporterà modifiche. Quindi l'ipotesi alternativa desiderata è: "La produttività media dei lavoratori in ufficio è superiore a quella dei lavoratori da casa".
Verifica se le varianze sono uguali:
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
La seconda deviazione standard è il doppio della prima, quindi le varianze sono diverse.
Ricorda la funzione ttest_ind per eseguire un t-test.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Si sta confrontando la produttività dei dipendenti che lavorano da casa e dall'ufficio. L'obiettivo è determinare se i lavoratori in ufficio abbiano una media di produttività superiore rispetto a quelli che lavorano da casa utilizzando un t-test per campioni indipendenti.
- Importare la libreria
scipy.statscon l'aliasst. - Utilizzare la funzione
st.ttest_ind()per eseguire il t-test con la seguente configurazione:
- Campioni:
office_workers,home_workers. - Ipotesi alternativa: office > home.
- Varianze non uguali (
equal_var=False).
- Salvare i risultati nelle variabili
tstatepvalue. - In base al valore di
pvalue, stampare uno dei seguenti messaggi:
"We support the null hypothesis, the mean values are equal"sepvalue > 0.05."We reject the null hypothesis, the mean values are different"altrimenti.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you show me how to perform the t-test with unequal variances?
What should the alternative hypothesis parameter be set to for this scenario?
What does the result of the t-test mean for the company's decision?
Awesome!
Completion rate improved to 2.63
Eseguire un t-test
Scorri per mostrare il menu
Un'azienda desidera determinare se esiste una differenza significativa nei livelli di produttività degli sviluppatori che lavorano da casa rispetto a quelli che lavorano in ufficio. Fortunatamente, sai già che un t-test può essere utile a questo scopo.
L'azienda dispone di due team di sviluppatori indipendenti: uno lavora da remoto e l'altro lavora in ufficio. Ti sono stati forniti due file, 'work_from_home.csv' e 'work_from_office.csv', che contengono il numero mensile di attività completate da ciascun sviluppatore.
Il compito è condurre un t-test. L'azienda vuole sapere se gli sviluppatori che lavorano in ufficio sono più produttivi rispetto a quelli che lavorano da casa. In tal caso, costringerà anche il secondo team a lavorare in ufficio. Se invece i lavoratori da casa risultano più produttivi, l'azienda non apporterà modifiche. Quindi l'ipotesi alternativa desiderata è: "La produttività media dei lavoratori in ufficio è superiore a quella dei lavoratori da casa".
Verifica se le varianze sono uguali:
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
La seconda deviazione standard è il doppio della prima, quindi le varianze sono diverse.
Ricorda la funzione ttest_ind per eseguire un t-test.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Si sta confrontando la produttività dei dipendenti che lavorano da casa e dall'ufficio. L'obiettivo è determinare se i lavoratori in ufficio abbiano una media di produttività superiore rispetto a quelli che lavorano da casa utilizzando un t-test per campioni indipendenti.
- Importare la libreria
scipy.statscon l'aliasst. - Utilizzare la funzione
st.ttest_ind()per eseguire il t-test con la seguente configurazione:
- Campioni:
office_workers,home_workers. - Ipotesi alternativa: office > home.
- Varianze non uguali (
equal_var=False).
- Salvare i risultati nelle variabili
tstatepvalue. - In base al valore di
pvalue, stampare uno dei seguenti messaggi:
"We support the null hypothesis, the mean values are equal"sepvalue > 0.05."We reject the null hypothesis, the mean values are different"altrimenti.
Soluzione
Grazie per i tuoi commenti!
single