t検定の実施

ある企業が、在宅勤務の開発者とオフィス勤務の開発者の生産性に有意な差があるかどうかを調べたいと考えています。t検定がこれに役立つことはすでにご存知の通りです。

この企業には2つの独立した開発チームがあり、一方はリモートで、もう一方はオフィスで勤務しています。各開発者の月ごとのタスク完了数が記録された 'work_from_home.csv' と 'work_from_office.csv' の2つのファイルが提供されています。

課題はt検定を実施することです。企業は、オフィス勤務の開発者が在宅勤務者よりも生産的かどうかを知りたがっています。もしそうであれば、2番目のチームもオフィス勤務に切り替えます。在宅勤務者の方が生産的な場合、企業は何も変更しません。したがって、望ましい対立仮説は「オフィス勤務者の平均生産性が在宅勤務者よりも高い」です。

分散が同じかどうかを確認：


              1234567
            
import pandas as pd

home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze()
office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze()
# Printing sample standard deviations
print('Home workers std:', home_workers.std())
print('Office workers std:', office_workers.std())

2番目の標準偏差は1番目の2倍であり、分散が異なる。 t-testを実行するためにttest_ind関数を思い出す。

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')

すべて明確でしたか？

フィードバックありがとうございます！

セクション 6. 章 7

single

メニューを表示するにはスワイプしてください

ある企業が、在宅勤務の開発者とオフィス勤務の開発者の生産性に有意な差があるかどうかを調べたいと考えています。t検定がこれに役立つことはすでにご存知の通りです。

この企業には2つの独立した開発チームがあり、一方はリモートで、もう一方はオフィスで勤務しています。各開発者の月ごとのタスク完了数が記録された 'work_from_home.csv' と 'work_from_office.csv' の2つのファイルが提供されています。

課題はt検定を実施することです。企業は、オフィス勤務の開発者が在宅勤務者よりも生産的かどうかを知りたがっています。もしそうであれば、2番目のチームもオフィス勤務に切り替えます。在宅勤務者の方が生産的な場合、企業は何も変更しません。したがって、望ましい対立仮説は「オフィス勤務者の平均生産性が在宅勤務者よりも高い」です。

分散が同じかどうかを確認：


              1234567
            
import pandas as pd

home_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_home.csv').squeeze()
office_workers = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/work_from_office.csv').squeeze()
# Printing sample standard deviations
print('Home workers std:', home_workers.std())
print('Office workers std:', office_workers.std())

2番目の標準偏差は1番目の2倍であり、分散が異なる。 t-testを実行するためにttest_ind関数を思い出す。

st.ttest_ind(a, b, equal_var=True, alternative='two-sided')

タスク

スワイプしてコーディングを開始

あなたは、在宅勤務とオフィス勤務の従業員の生産性を比較しています。目標は、オフィス勤務者の平均生産性が在宅勤務者よりも高いかどうかを、独立サンプルのt検定を用いて判断することです。

scipy.statsライブラリをstというエイリアスでインポートします。
st.ttest_ind()関数を使い、次の設定でt検定を実施します:

サンプル: office_workers, home_workers
対立仮説: office > home
分散は等しくない（equal_var=False）

結果をtstatとpvalueという変数に格納します。
pvalueに基づき、次のいずれかのメッセージを出力します:

"We support the null hypothesis, the mean values are equal"（pvalue > 0.05の場合）
"We reject the null hypothesis, the mean values are different"（それ以外の場合）

解答

実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する

すべて明確でしたか？

フィードバックありがとうございます！

セクション 6. 章 7

single

AIに質問する

何でも質問するか、提案された質問の1つを試してチャットを始めてください