6.5 计算复杂度¶

进行预测需要从根到叶遍历决策树。决策树通常是近似平衡的，因此遍历决策树需要经过大约\(\text{O}(log_2(m))\)个节点。由于每个节点仅需要检查一个特征值，因此总体预测复杂度为\(\text{O}(log_2(m))\)。与特征数量无关。因此，即使处理大训练集，预测也非常快。训练算法比较每个节点上所有样本上的所有特征（如果设置了max_features，则更少）。比较每个节点上所有样本的所有特征会导致训练复杂度为\(\text{O}(n \times m log_2(m))\)。对于小训练集（少于几千个实例），Scikit-Learn可以通过对数据进行预排序（设置presort=True）来加快训练速度，但是这样做会大大降低大训练集的训练速度。