惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Google DeepMind News
Google DeepMind News
SecWiki News
SecWiki News
V
Visual Studio Blog
博客园 - 三生石上(FineUI控件)
WordPress大学
WordPress大学
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
博客园 - 【当耐特】
Martin Fowler
Martin Fowler
宝玉的分享
宝玉的分享
F
Fortinet All Blogs
U
Unit 42
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
aimingoo的专栏
aimingoo的专栏
V
V2EX
Apple Machine Learning Research
Apple Machine Learning Research
博客园 - 聂微东
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
O
OpenAI News
T
Troy Hunt's Blog
TaoSecurity Blog
TaoSecurity Blog
小众软件
小众软件
MongoDB | Blog
MongoDB | Blog
Recent Commits to openclaw:main
Recent Commits to openclaw:main
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
L
LINUX DO - 最新话题
N
News | PayPal Newsroom
PCI Perspectives
PCI Perspectives
Engineering at Meta
Engineering at Meta
美团技术团队
J
Java Code Geeks
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
人人都是产品经理
人人都是产品经理
雷峰网
雷峰网
V
Vulnerabilities – Threatpost
B
Blog RSS Feed
NISL@THU
NISL@THU
Security Latest
Security Latest
The Register - Security
The Register - Security
酷 壳 – CoolShell
酷 壳 – CoolShell
The GitHub Blog
The GitHub Blog
S
SegmentFault 最新的问题
N
News and Events Feed by Topic
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
S
Schneier on Security
罗磊的独立博客
Know Your Adversary
Know Your Adversary
Hacker News: Ask HN
Hacker News: Ask HN
S
Security Affairs
月光博客
月光博客
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO

Dreamwings

当表达细节成为 FP4 新瓶颈时,我们是否仍要坚守 E2M1? – Dreamwings 聊一聊我们最近开源的 Ling 2.0 原生 FP8 混合精度训练 – Dreamwings 师兄师姐说,给校招新人的建议 – Dreamwings 《燃烧吧!天才程序员》第三季已全网上线! – Dreamwings 写给新入学的你们(研究生篇) – Dreamwings 【论文分享】图上做伪标签生成缓解推荐冷启动 – Dreamwings 给师弟师妹们的一次经验分享 – Dreamwings 验证 log4j2 漏洞(JNDI 注入 CVE-2021-44228) – Dreamwings 字节安全 AI 挑战赛 – 色导用户识别 – ECNU_ICA – Dreamwings ST-GNN 一类时空图神经网络 – Dreamwings 推荐系统之 trade-off – Dreamwings
xgboost 目标函数中的泰勒展开式 – Dreamwings
@ 千千 · 2021-12-07 · via Dreamwings

  • /
  • 发表于 2021 年 12 月 07 日
  • /
  • 任意门
  • /
  • 2,040 次围观

问题

七月份的时候,女友在复习 xgboost 的时候对目标函数与泰拉展开式的关系有点迷糊,所以就有了这次的答疑。

参考博客:https://blog.csdn.net/v_JULY_v/article/details/81410574

img

答疑

泰勒展开式:

$$ f(x + \Delta x) \simeq f(x) + f'(x)\Delta x + \frac{1}{2}f”(x)\Delta x^2 $$

这个是目标函数:

$$ Obj^{(t)} = \sum_{i=1}^n l\Big(y_i, \hat{y}_i^{(t-1)} + f_t(x_i)\Big) + \Omega(f_t) + constant $$

在 xgboost 里,因为整个流程是用第 $t$ 棵子树去拟合前 $t-1$ 棵子树拟合结果的残差。

也就是说假如有 $t$ 棵树,那对类别 $i$ 预测的结果是这 $t$ 棵树分别对 $i$ 预测结果的和。

所以有着这样的公式存在:$\hat{y}_i^{(t)}=\hat{y}_i^{(t-1)} + f_t(x_i)$

其中,$\hat{y}_i^{(t-1)}$ 是前 $t-1$ 棵树预测的结果

然后对着泰勒展开式,把 $\hat{y}_i^{(t-1)}$ 看成 $x$,$f_t(x_i)$ 看成 $\Delta x$,即:

$$ x = \hat{y}_i^{(t-1)} $$

$$ △x = f_t(x_i) $$

$$ f(x+△x) \simeq f(x)+f'(x)△x+\frac{1}{2}f”(x)△x^2 $$

$$ f(x+△x)=f(\hat{y}_i^{(t-1)}+f_t(x_i))=f(y_i, \hat{y}_i^{(t-1)}+f_t(x_i)) $$

这样一套,就是目标函数了,所以用泰勒展开式代替了目标函数。