セクション 6. 章 8
single
対応のあるT検定
メニューを表示するにはスワイプしてください
次の関数は対応のあるt検定を実行します:
ttest_rel(a, b, alternative='two-sided')
この手順は独立サンプルの場合と似ていますが、ここでは分散の等質性を確認する必要はありません。対応のあるt検定は、分散が等しいことを前提としません。
対応のあるt検定では、サンプルサイズが等しいことが重要です。
この情報を踏まえて、対応のあるt検定の実施に進みます。
ここでは、特定のアプリのダウンロード数に関するデータがあります。サンプルを確認すると、平均値がほぼ同じであることがわかります。
123456789101112import pandas as pd import matplotlib.pyplot as plt # Read the data before = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/before.csv').squeeze() after = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a849660e-ddfa-4033-80a6-94a1b7772e23/Testing2.0/after.csv').squeeze() # Plot histograms plt.hist(before, alpha=0.7) plt.hist(after, alpha=0.7) # Plot the means plt.axvline(before.mean(), color='blue', linestyle='dashed') plt.axvline(after.mean(), color='gold', linestyle='dashed')
タスク
スワイプしてコーディングを開始
変更によって平均ダウンロード数が増加したかどうかを検証します。
2つのデータセット — before と after — が提供されており、それぞれ変更前と後のダウンロード数を表します。
仮説は以下の通りです:
- H₀: 変更前後でダウンロード数の平均は同じである。
- Hₐ: 変更後のダウンロード数の平均が増加している。
これらのサンプルを用いて対応のあるt検定(paired t-test)を実施し、対応する対立仮説を検証してください。
st.ttest_rel()関数を使って対応のあるt検定を行います。- 最初の2つの引数として
afterとbeforeをこの順番で渡します。 - 平均が変更後に大きいかどうかを検定するため、引数
alternative='greater'を設定します。 - 結果を変数
statsとpvalueに格納します。 pvalueを用いて帰無仮説を支持するか棄却するかを判断します。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 6. 章 8
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください