paper-xgboost

发表于 2018-05-14 | 阅读次数: | 浏览次

XGBoost: A Scalable Tree Boosting System

论文提出的贡献点：

一个新的tree learning algorithm，可以有效处理sparse data
理论上合理的加权分位数程序可以在近似树学习中处理实例权重。贡献点：
设计一个高可拓展性的end-to-end tree boosting系统
理论上合理的加权分位数程序可以在近似树学习中处理实例权重。
我们引入了一种新颖的并行树学习稀疏感知算法。
我们针对树学习提出了一种有效的缓存感知块结构
提出一个一个正则化的学习目标作为进一步的改进。

Tree boosting算法

正则化的学习目标

上图显示了一个Ensemble算法的过程，可以概括为一个加法模型。

和decision tree不同，每个回归树都会在叶子节点有一个连续的score值，我们只用$w_i$表示第i个节点的呃score值。

从而，就可以定义一个包含正则项的损失函数：

在这里$l$表示一个自定义的凸loss function。
加法的正则化项可以平滑最终学习到的权值，避免出现过拟合。

当去除了正则化项的时候，学习的目标就会变成传统的gradient tree boosting算法。

Gradient Tree Boosting

分享到：收藏夹复制网址邮件微信 QQ空间腾讯微博豆瓣一键分享更多