7.3 随机补丁和随机空间¶
BaggingClassifier类也支持对特征进行采样。采样由两个超参数控制:max_features
和bootstrap_features
。它们的工作方式与max_samples
和bootstrap
相同,但用于特征采样而不是实例采样。因此,每个预测器将用输入特征的随机子集进行训练。
这对于处理高维输入(例如图像)特别有用。
对训练实例和特征都进行抽样,这称为随机补丁方法
而保留所有训练实例(即bootstrap=False
并且max_samples=1.0
)但是对特征进行抽样(即bootstrap_features=True
并且/或max_features<1.0
),这被称为随机子空间法。
对特征抽样给预测器带来更大的多样性,所以以略高一点的偏差换取了更低的方差。