Realizar um Teste T
Uma empresa deseja determinar se existe uma diferença significativa nos níveis de produtividade de desenvolvedores que trabalham em casa em comparação com aqueles que trabalham no escritório. Felizmente, você já sabe que um teste t pode ajudar com isso.
A empresa possui duas equipes de desenvolvedores independentes: uma trabalha remotamente e a outra trabalha no escritório. Foram fornecidos dois arquivos, 'work_from_home.csv'
e 'work_from_office.csv'
, que contêm as contagens mensais de tarefas concluídas por cada desenvolvedor.
A tarefa consiste em realizar um teste t. A empresa deseja saber se os desenvolvedores que trabalham no escritório são mais produtivos do que os que trabalham em casa. Caso isso seja comprovado, a empresa também exigirá que a segunda equipe trabalhe no escritório. Se os trabalhadores remotos forem mais produtivos, nenhuma alteração será feita. Portanto, a hipótese alternativa desejada é "A produtividade média dos trabalhadores de escritório é maior do que a dos trabalhadores remotos".
Vamos verificar se as variâncias são iguais:
import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
O segundo desvio padrão é o dobro do primeiro, portanto as variâncias são diferentes.
Lembre-se da função ttest_ind
para realizar um teste t.
python
Swipe to start coding
- Importe
scipy.stats
usando o aliasst
. - Realize um teste t com a seguinte configuração:
- Amostras:
home_workers
,office_workers
; - Hipótese alternativa: office > home;
- Sem homogeneidade de variâncias.
- Amostras:
Solução
Obrigado pelo seu feedback!