Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ 相互作用特徴量の作成 | セクション
データ前処理と特徴量エンジニアリング

book相互作用特徴量の作成

メニューを表示するにはスワイプしてください

Note
定義

相互作用特徴量は、2つ以上の既存の特徴量を乗算除算加算などの数学的操作によって組み合わせて作成される新しい変数であり、これらの変数がターゲットにどのように共同で影響を与えるかを反映するもの。

相互作用特徴量を作成することで、Titanicデータセット内のAgeFarePclassSexなどの変数間の複雑な関係性を捉えることが可能。1つの変数が生存に与える影響は、他の変数の値によって異なる場合がある。例えば、乗客クラスが生存に与える効果は性別によって異なったり、若い乗客は高い運賃の恩恵をより受ける可能性がある。Age * FarePclass * Sex_encodedのような特徴量を組み合わせることで、モデルがこれらの微妙なパターンを学習し、変数同士の相互作用に基づいて誰が生存したかをより正確に予測できるようになる。

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

次のうち、タイタニックデータセットで Age * FarePclass * Sex_encoded のように、変数間の関係を捉える有用な相互作用特徴量を最もよく表しているものはどれですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  10

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1.  10
some-alt