セクション 6. 章 7
single
t検定の実施
メニューを表示するにはスワイプしてください
ある企業が、在宅勤務の開発者とオフィス勤務の開発者の生産性に有意な差があるかどうかを調べたいと考えています。t検定がこれに役立つことはすでにご存知の通りです。
この企業には2つの独立した開発チームがあり、一方はリモートで、もう一方はオフィスで勤務しています。各開発者の月ごとのタスク完了数が記録された 'work_from_home.csv' と 'work_from_office.csv' の2つのファイルが提供されています。
課題はt検定を実施することです。企業は、オフィス勤務の開発者が在宅勤務者よりも生産的かどうかを知りたがっています。もしそうであれば、2番目のチームもオフィス勤務に切り替えます。在宅勤務者の方が生産的な場合、企業は何も変更しません。したがって、望ましい対立仮説は「オフィス勤務者の平均生産性が在宅勤務者よりも高い」です。
分散が同じかどうかを確認:
1234567import pandas as pd home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze() office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze() # Printing sample standard deviations print('Home workers std:', home_workers.std()) print('Office workers std:', office_workers.std())
2番目の標準偏差は1番目の2倍であり、分散が異なる。
t-testを実行するためにttest_ind関数を思い出す。
st.ttest_ind(a, b, equal_var=True, alternative='two-sided')
タスク
スワイプしてコーディングを開始
あなたは、在宅勤務とオフィス勤務の従業員の生産性を比較しています。 目標は、オフィス勤務者の平均生産性が在宅勤務者よりも高いかどうかを、独立サンプルのt検定を用いて判断することです。
scipy.statsライブラリをstというエイリアスでインポートします。st.ttest_ind()関数を使い、次の設定でt検定を実施します:
- サンプル:
office_workers,home_workers - 対立仮説: office > home
- 分散は等しくない(
equal_var=False)
- 結果を
tstatとpvalueという変数に格納します。 pvalueに基づき、次のいずれかのメッセージを出力します:
"We support the null hypothesis, the mean values are equal"(pvalue > 0.05の場合)"We reject the null hypothesis, the mean values are different"(それ以外の場合)
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 6. 章 7
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください