Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ ランダムフォレストの概念 | セクション
木構造アンサンブル手法

bookランダムフォレストの概念

メニューを表示するにはスワイプしてください

Note
定義

ランダムフォレストは、アンサンブル学習手法の一つであり、複数の決定木を構築し、それぞれ異なるデータと特徴量のランダムなサブセットで学習させる方法。すべての決定木の予測結果を組み合わせて(分類の場合は多数決、回帰の場合は平均)最終的な出力を生成。

ランダムフォレストの構築手順

ランダムフォレストは、ランダム性と多様性を導入する一連の構造化された手順を通じて、複数の決定木からなるアンサンブルを構築。主な構築手順は以下の通り:

  1. ブートストラップサンプリング
    • 元のデータセットから復元抽出によるランダムサンプルを作成し、各決定木のためのブートストラップサンプルを生成;
    • 各決定木は異なるブートストラップサンプルを受け取るため、あるデータポイントが複数回含まれる場合や、含まれない場合もある。
  2. 各分割での特徴量サブセット選択
    • 各決定木の成長時、各分割ごとに全特徴量の中からランダムにサブセットを選択;
    • 最良の分割はこのランダムサブセットからのみ選ばれ、各決定木が異なる特徴量や分割点を考慮することを強制。
  3. 決定木の学習
    • 各決定木は、それぞれのブートストラップサンプルと、各分割で選択された特徴量のみを用いて独立に学習;
    • 決定木は指定された深さ、またはその他の停止基準に達するまで成長。
  4. 予測の集約
    • 分類タスクでは、各決定木の予測クラスを集め、多数決で最終クラスを決定;
    • 回帰タスクでは、すべての決定木の予測値を平均して最終出力を生成。

このプロセスにより、各決定木は使用するデータと特徴量の両方で独自性を持ち、より堅牢で高精度なアンサンブルモデルが実現される。

ランダムフォレスト回帰の集約式

ランダムフォレスト回帰では、各データポイントに対する最終予測値は、すべての決定木による予測値の平均となる。nn本の決定木があり、それぞれの木が入力xxに対してy^i\hat{y}_iを予測した場合、集約された予測値y^\hat{y}は次の式で表される:

y^=1ni=1ny^i\hat{y} = \frac{1}{n} \sum_{i=1}^{n} \hat{y}_i

この平均化により、個々の決定木の誤差の影響が軽減され、より安定かつ高精度な予測が得られる。

question mark

ランダムフォレストが単一の決定木と比べて過学習を抑制する仕組みとして最も適切な説明はどれですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  5

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1.  5
some-alt