Réaliser un Test T
Une entreprise souhaite déterminer s'il existe une différence significative dans les niveaux de productivité des développeurs travaillant à domicile par rapport à ceux travaillant au bureau. Heureusement, vous savez déjà qu'un test t peut aider à répondre à cette question.
L'entreprise dispose de deux équipes de développeurs indépendantes : l'une travaille à distance, l'autre au bureau. Deux fichiers vous ont été fournis, 'work_from_home.csv'
et 'work_from_office.csv'
, contenant le nombre mensuel de tâches accomplies par chaque développeur.
La tâche consiste à réaliser un test t. L'entreprise souhaite savoir si les développeurs travaillant au bureau sont plus productifs que ceux travaillant à domicile. Si c'est le cas, elle obligera également la seconde équipe à travailler au bureau. Si les travailleurs à domicile sont plus productifs, aucun changement ne sera effectué. L'hypothèse alternative souhaitée est donc : « La productivité moyenne des travailleurs au bureau est supérieure à celle des travailleurs à domicile ».
Vérification de l'égalité des variances :
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
L'écart type du second groupe est deux fois supérieur à celui du premier, donc les variances diffèrent.
Rappel de la fonction ttest_ind
pour effectuer un test t.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Vous comparez la productivité des employés travaillant à domicile et au bureau. Votre objectif est de déterminer si les employés de bureau ont une productivité moyenne supérieure à celle des employés à domicile en utilisant un test t pour échantillons indépendants.
- Importez la bibliothèque
scipy.stats
avec l'aliasst
. - Utilisez la fonction
st.ttest_ind()
pour effectuer le test t avec la configuration suivante :
- Échantillons :
office_workers
,home_workers
. - Hypothèse alternative : office > home.
- Les variances ne sont pas égales (
equal_var=False
).
- Stockez les résultats dans les variables
tstat
etpvalue
. - En fonction de la valeur de
pvalue
, affichez l'un des messages suivants :
"We support the null hypothesis, the mean values are equal"
sipvalue > 0.05
."We reject the null hypothesis, the mean values are different"
sinon.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 2.63
Réaliser un Test T
Glissez pour afficher le menu
Une entreprise souhaite déterminer s'il existe une différence significative dans les niveaux de productivité des développeurs travaillant à domicile par rapport à ceux travaillant au bureau. Heureusement, vous savez déjà qu'un test t peut aider à répondre à cette question.
L'entreprise dispose de deux équipes de développeurs indépendantes : l'une travaille à distance, l'autre au bureau. Deux fichiers vous ont été fournis, 'work_from_home.csv'
et 'work_from_office.csv'
, contenant le nombre mensuel de tâches accomplies par chaque développeur.
La tâche consiste à réaliser un test t. L'entreprise souhaite savoir si les développeurs travaillant au bureau sont plus productifs que ceux travaillant à domicile. Si c'est le cas, elle obligera également la seconde équipe à travailler au bureau. Si les travailleurs à domicile sont plus productifs, aucun changement ne sera effectué. L'hypothèse alternative souhaitée est donc : « La productivité moyenne des travailleurs au bureau est supérieure à celle des travailleurs à domicile ».
Vérification de l'égalité des variances :
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
L'écart type du second groupe est deux fois supérieur à celui du premier, donc les variances diffèrent.
Rappel de la fonction ttest_ind
pour effectuer un test t.
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
Swipe to start coding
Vous comparez la productivité des employés travaillant à domicile et au bureau. Votre objectif est de déterminer si les employés de bureau ont une productivité moyenne supérieure à celle des employés à domicile en utilisant un test t pour échantillons indépendants.
- Importez la bibliothèque
scipy.stats
avec l'aliasst
. - Utilisez la fonction
st.ttest_ind()
pour effectuer le test t avec la configuration suivante :
- Échantillons :
office_workers
,home_workers
. - Hypothèse alternative : office > home.
- Les variances ne sont pas égales (
equal_var=False
).
- Stockez les résultats dans les variables
tstat
etpvalue
. - En fonction de la valeur de
pvalue
, affichez l'un des messages suivants :
"We support the null hypothesis, the mean values are equal"
sipvalue > 0.05
."We reject the null hypothesis, the mean values are different"
sinon.
Solution
Merci pour vos commentaires !
single