バギングとは?

ブートストラップ・アグリゲーティング(bootstrap aggregating)またはバギング(bagging)とは、学習データセットの異なるサブセットに複数のモデルを適合させ、すべてのモデルからの予測値を結合して予測を行うメタアルゴリズムのこと。アンサンブル・アルゴリズムともいう。

ランダムフォレストは、決定木にたいしてバギングの考え方を適用したものと捉えることができる。各データサンプルで使用される特徴のサブセットをランダムに選択(学習データセットのサブセットの抽出)し、複数の決定木を作る。