ランダムフォレストの概念
メニューを表示するにはスワイプしてください
定義
ランダムフォレストは、アンサンブル学習手法の一つであり、複数の決定木を構築し、それぞれ異なるデータと特徴量のランダムなサブセットで学習させる方法。すべての決定木の予測結果を組み合わせて(分類の場合は多数決、回帰の場合は平均)最終的な出力を生成。
ランダムフォレストの構築手順
ランダムフォレストは、ランダム性と多様性を導入する一連の構造化された手順を通じて、複数の決定木からなるアンサンブルを構築。主な構築手順は以下の通り:
- ブートストラップサンプリング:
- 元のデータセットから復元抽出によるランダムサンプルを作成し、各決定木のためのブートストラップサンプルを生成;
- 各決定木は異なるブートストラップサンプルを受け取るため、あるデータポイントが複数回含まれる場合や、含まれない場合もある。
- 各分割での特徴量サブセット選択:
- 各決定木の成長時、各分割ごとに全特徴量の中からランダムにサブセットを選択;
- 最良の分割はこのランダムサブセットからのみ選ばれ、各決定木が異なる特徴量や分割点を考慮することを強制。
- 決定木の学習:
- 各決定木は、それぞれのブートストラップサンプルと、各分割で選択された特徴量のみを用いて独立に学習;
- 決定木は指定された深さ、またはその他の停止基準に達するまで成長。
- 予測の集約:
- 分類タスクでは、各決定木の予測クラスを集め、多数決で最終クラスを決定;
- 回帰タスクでは、すべての決定木の予測値を平均して最終出力を生成。
このプロセスにより、各決定木は使用するデータと特徴量の両方で独自性を持ち、より堅牢で高精度なアンサンブルモデルが実現される。
ランダムフォレスト回帰の集約式
ランダムフォレスト回帰では、各データポイントに対する最終予測値は、すべての決定木による予測値の平均となる。n本の決定木があり、それぞれの木が入力xに対してy^iを予測した場合、集約された予測値y^は次の式で表される:
y^=n1i=1∑ny^iこの平均化により、個々の決定木の誤差の影響が軽減され、より安定かつ高精度な予測が得られる。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 5
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 1. 章 5