Summary  
Demonstrates how to construct a contingency table from categorical count data and implement a chi-square test to assess whether observed differences between groups are statistically significant.

General domain of usage  
A/B testing for user conversion outcomes

**カテゴリカルな結果**（例えば、ユーザーがコンバージョンしたかどうか）を用いたA/Bテストを実施する場合、**カイ二乗検定**はグループ間の観測された差が統計的に有意かどうかを判断する方法を提供します。`t-tests`や`z-tests`が連続値や比率データに用いられるのに対し、**カイ二乗検定**は**カテゴリごとのカウントデータ**に特化しています。A/Bテストの文脈では、`control`グループと`treatment`グループ間でコンバージョンしたユーザーの割合が異なるかどうかを、コンバージョンの分布について仮定せずに知りたい場合によく利用されます。

import pandas as pd
from scipy.stats import chi2_contingency

# Example conversion data for A/B groups
data = {
    "Group": ["Control", "Control", "Treatment", "Treatment"],
    "Outcome": ["Converted", "Not Converted", "Converted", "Not Converted"],
    "Count": [120, 880, 150, 850]
}

df = pd.DataFrame(data)

# Create a contingency table
contingency_table = df.pivot(index="Group", columns="Outcome", values="Count")

# Run the chi-square test
chi2, p, dof, expected = chi2_contingency(contingency_table)

print(f"Chi-square statistic: {chi2:.2f}")
print(f"p-value: {p:.4f}")
print("Expected frequencies:")
print(pd.DataFrame(expected, index=contingency_table.index, columns=contingency_table.columns))

### カイ二乗検定結果の解釈

カイ二乗検定を実行した際は、以下の主要な出力に注目します。

- **カイ二乗統計量**：グループ間に差がない場合に期待されるカウントから、観測されたカウントがどれだけずれているかを測定；
- **p値**：真の差が存在しないと仮定した場合に、データで観測されたほど大きな差が生じる確率を示します。

判断基準：

- **p値**が有意水準（一般的に`0.05`）未満の場合、controlグループとtreatmentグループ間でコンバージョン率に統計的に有意な差があると結論付けられます；
- **p値**が有意水準以上の場合、差があると主張する十分な証拠はありません。

**重要事項：**
- 有意な結果は差が存在することを示しますが、どちらのグループが優れているかやその差の大きさまでは示しません；
- 検定の前提条件が満たされているかを確認するため、観測値と期待値の頻度を必ず確認してください；
- カイ二乗検定は他の分析と併用し、A/Bテスト結果を総合的に理解することが重要です。

A/Bテストのカイ二乗検定でp値が0.05未満であることは何を示しますか？

データアナリスト向けの仮説検定の基礎に特化した簡潔な初心者向けコース。仮説の立案、t検定（1標本、2標本、対応あり）、z検定、カイ二乗検定、検定の前提条件、適切な統計検定の選択方法を扱います。

カイ二乗A/B

カイ二乗検定結果の解釈