相互作用特徴量の作成
メニューを表示するにはスワイプしてください
定義
相互作用特徴量は、2つ以上の既存の特徴量を乗算、除算、加算などの数学的操作によって組み合わせて作成される新しい変数であり、これらの変数がターゲットにどのように共同で影響を与えるかを反映するもの。
相互作用特徴量を作成することで、Titanicデータセット内のAge、Fare、Pclass、Sexなどの変数間の複雑な関係性を捉えることが可能。1つの変数が生存に与える影響は、他の変数の値によって異なる場合がある。例えば、乗客クラスが生存に与える効果は性別によって異なったり、若い乗客は高い運賃の恩恵をより受ける可能性がある。Age * FareやPclass * Sex_encodedのような特徴量を組み合わせることで、モデルがこれらの微妙なパターンを学習し、変数同士の相互作用に基づいて誰が生存したかをより正確に予測できるようになる。
1234567891011121314151617181920import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 10
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 1. 章 10