8. 降维

许多机器学习问题涉及每个训练实例的成千上万甚至数百万个特征。正如我们将看到的那样,所有这些特征不仅使训练变得极其缓慢,而且还会使找到好的解决方案变得更加困难。这个问题通常称为维度的诅咒。

本章将介绍两种主要的数据降维方法(投影和流形学习),以及最流行的三种数据降维技术:PCA、Kernal PCA以及LLE。