惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
Netflix TechBlog - Medium
V
Vulnerabilities – Threatpost
Google Online Security Blog
Google Online Security Blog
Hugging Face - Blog
Hugging Face - Blog
L
LINUX DO - 热门话题
云风的 BLOG
云风的 BLOG
P
Proofpoint News Feed
D
Docker
C
Cyber Attacks, Cyber Crime and Cyber Security
MyScale Blog
MyScale Blog
P
Palo Alto Networks Blog
T
Tenable Blog
P
Privacy International News Feed
Google DeepMind News
Google DeepMind News
小众软件
小众软件
Cisco Talos Blog
Cisco Talos Blog
aimingoo的专栏
aimingoo的专栏
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
A
Arctic Wolf
C
Cybersecurity and Infrastructure Security Agency CISA
C
Cisco Blogs
T
Threat Research - Cisco Blogs
NISL@THU
NISL@THU
The Hacker News
The Hacker News
Project Zero
Project Zero
AWS News Blog
AWS News Blog
Simon Willison's Weblog
Simon Willison's Weblog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
T
Threatpost
V
Visual Studio Blog
The GitHub Blog
The GitHub Blog
The Cloudflare Blog
Last Week in AI
Last Week in AI
Jina AI
Jina AI
Cyberwarzone
Cyberwarzone
The Register - Security
The Register - Security
C
CXSECURITY Database RSS Feed - CXSecurity.com
Vercel News
Vercel News
D
Darknet – Hacking Tools, Hacker News & Cyber Security
MongoDB | Blog
MongoDB | Blog
U
Unit 42
Scott Helme
Scott Helme
A
About on SuperTechFans
WordPress大学
WordPress大学
F
Fortinet All Blogs
大猫的无限游戏
大猫的无限游戏
G
GRAHAM CLULEY
Latest news
Latest news
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
S
Schneier on Security

Dreamwings

当表达细节成为 FP4 新瓶颈时,我们是否仍要坚守 E2M1? – Dreamwings 聊一聊我们最近开源的 Ling 2.0 原生 FP8 混合精度训练 – Dreamwings 师兄师姐说,给校招新人的建议 – Dreamwings 《燃烧吧!天才程序员》第三季已全网上线! – Dreamwings 写给新入学的你们(研究生篇) – Dreamwings 【论文分享】图上做伪标签生成缓解推荐冷启动 – Dreamwings 给师弟师妹们的一次经验分享 – Dreamwings 验证 log4j2 漏洞(JNDI 注入 CVE-2021-44228) – Dreamwings 字节安全 AI 挑战赛 – 色导用户识别 – ECNU_ICA – Dreamwings ST-GNN 一类时空图神经网络 – Dreamwings 推荐系统之 trade-off – Dreamwings
xgboost 目标函数中的泰勒展开式 – Dreamwings
@ 千千 · 2021-12-07 · via Dreamwings

  • /
  • 发表于 2021 年 12 月 07 日
  • /
  • 任意门
  • /
  • 2,040 次围观

问题

七月份的时候,女友在复习 xgboost 的时候对目标函数与泰拉展开式的关系有点迷糊,所以就有了这次的答疑。

参考博客:https://blog.csdn.net/v_JULY_v/article/details/81410574

img

答疑

泰勒展开式:

$$ f(x + \Delta x) \simeq f(x) + f'(x)\Delta x + \frac{1}{2}f”(x)\Delta x^2 $$

这个是目标函数:

$$ Obj^{(t)} = \sum_{i=1}^n l\Big(y_i, \hat{y}_i^{(t-1)} + f_t(x_i)\Big) + \Omega(f_t) + constant $$

在 xgboost 里,因为整个流程是用第 $t$ 棵子树去拟合前 $t-1$ 棵子树拟合结果的残差。

也就是说假如有 $t$ 棵树,那对类别 $i$ 预测的结果是这 $t$ 棵树分别对 $i$ 预测结果的和。

所以有着这样的公式存在:$\hat{y}_i^{(t)}=\hat{y}_i^{(t-1)} + f_t(x_i)$

其中,$\hat{y}_i^{(t-1)}$ 是前 $t-1$ 棵树预测的结果

然后对着泰勒展开式,把 $\hat{y}_i^{(t-1)}$ 看成 $x$,$f_t(x_i)$ 看成 $\Delta x$,即:

$$ x = \hat{y}_i^{(t-1)} $$

$$ △x = f_t(x_i) $$

$$ f(x+△x) \simeq f(x)+f'(x)△x+\frac{1}{2}f”(x)△x^2 $$

$$ f(x+△x)=f(\hat{y}_i^{(t-1)}+f_t(x_i))=f(y_i, \hat{y}_i^{(t-1)}+f_t(x_i)) $$

这样一套,就是目标函数了,所以用泰勒展开式代替了目标函数。