集成学习(Ensemble Learning)
集成学习通过构建并结合多个学习器来完成学习任务。 集成学习的一般结构: 先产生一组“个体学习器”,再用某种策略将它们结合起来。 个体学习器通常由一个现有的学习算法从训练数据产生。
信息是用来消除随机不确定性的东西。 —— 香农
本篇主要包含ID3,C4.5在示例数据集上的手动实现以及C5.0的R实现。
决策树学习采用的是自顶向下的递归方法,其基本思想是以信息熵(或其他目标)为度量,构造一棵熵值下降最快的树,到叶子节点处的熵值为零,此时每个叶节点中的实例都属于同一类。
本篇包含adaboost的手动实现例子以及adaboost在R上的实现例子。