惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

V
Visual Studio Blog
T
The Exploit Database - CXSecurity.com
Cyberwarzone
Cyberwarzone
C
CXSECURITY Database RSS Feed - CXSecurity.com
E
Exploit-DB.com RSS Feed
S
Security @ Cisco Blogs
Scott Helme
Scott Helme
H
Hacker News: Front Page
I
Intezer
N
News and Events Feed by Topic
V
V2EX - 技术
L
LINUX DO - 热门话题
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
K
Kaspersky official blog
S
Securelist
Latest news
Latest news
P
Proofpoint News Feed
C
Cisco Blogs
T
Troy Hunt's Blog
The Register - Security
The Register - Security
V
Vulnerabilities – Threatpost
T
Threat Research - Cisco Blogs
Microsoft Azure Blog
Microsoft Azure Blog
L
LangChain Blog
B
Blog RSS Feed
小众软件
小众软件
T
Tenable Blog
P
Proofpoint News Feed
MyScale Blog
MyScale Blog
SecWiki News
SecWiki News
Jina AI
Jina AI
Know Your Adversary
Know Your Adversary
Recorded Future
Recorded Future
Google Online Security Blog
Google Online Security Blog
D
Docker
W
WeLiveSecurity
Attack and Defense Labs
Attack and Defense Labs
T
Tor Project blog
A
About on SuperTechFans
U
Unit 42
S
Security Archives - TechRepublic
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
O
OpenAI News
NISL@THU
NISL@THU
雷峰网
雷峰网
Vercel News
Vercel News
AWS News Blog
AWS News Blog
L
Lohrmann on Cybersecurity
Google DeepMind News
Google DeepMind News

钛媒体:引领未来商业与生活新知

涨价、卡审、分成下滑,AI剧拐点:有人退圈、有人坚守,不提质就出局 宇树其实没得选 25年来的最强投资人阵容是谁?福布斯发布全球最佳创投人“全明星”榜 石药集团:一季报出现波动,发生了什么? AI淘汰的是流程,不是SSC SK海力士市值突破1万亿美元,“逆天改命”终成存储之王 消费级机器人大爆发,我在今年看到的产业新变化 挤满商场B1层的“小漂亮饭”,能火多久? AI耳机卷生卷死,为何巨头都想占领你的耳朵?​ 谷雨十周年:一个成分“格物派”的逆周期生长样本 市值$1600亿广告平台裁员50%,CEO:不适应AI的员工,会阻碍整个公司 马维斯(Marvis)实测:他给了我一些可以独处的时间-钛媒体官方网站 AI短剧,正在抢走全球游戏用户-钛媒体官方网站 当年最火的“童颜针”,破产了 从PC到AI,联想中国一场必打的仗-钛媒体官方网站 字节小荷再发力,我对AI医疗的几点思考-钛媒体官方网站 瑞士工程科技企业Algorized研发人体感知边缘AI模型,确保人机安全协作 | 瑞士创新100强-钛媒体官方网站 香奈儿迪奥背后的中国“打工人”,年入10亿,却卡在IPO大门口-钛媒体官方网站 钛媒体AGI开启专属报道通道:让 AI 落地价值被看见-钛媒体官方网站 戴康股价飙升20%,电信和数据中心建设热潮仍在持续-钛媒体官方网站 MGM股票获得两项上调评级,该股能否收于2024年以来最高水平?-钛媒体官方网站 据摩根大通称,现在买入联邦快递股票的两个理由-钛媒体官方网站 618的旧战场,迎来AI的试炼场-钛媒体官方网站 新拼姆要解的出海大题,难度超出你想象-钛媒体官方网站 快手新老铁,不愿天天见 中证医药创10年新低,“老登”落幕静悄悄-钛媒体官方网站 高端酒店,终于进入“昆明时间”-钛媒体官方网站 酒旅圈反腐地震,这些岗位为啥一查就是一连串?-钛媒体官方网站 腾讯游戏AI大爆发,押注下一代引擎决战AI渲染高地-钛媒体官方网站 "新疆奶王"的困局:奶价跌了,牛卖了,疆外市场也在缩水-钛媒体官方网站 创新药行业残酷真相:拿不回现金的BD一文不值-钛媒体官方网站 从技术图表看,特斯拉可能正在酝酿一次重大突破-钛媒体官方网站 光伏上市企业掀起家族内斗,拓日新能董事长夫妇起诉亲生女儿:一场把家搬进法庭的控制权争夺战 买Token防骗指南-钛媒体官方网站 汉坦病毒带火小众IVD储备赛道-钛媒体官方网站 “白人饭巨头”赛百味押注全时段,4000家门店背后的野心与掣肘-钛媒体官方网站 西安银行分红比例再降,外资大股东“无声抗议”-钛媒体官方网站 无人配送,怎么成了“新石器们”的角力场-钛媒体官方网站 珀莱雅为什么高价买下“少女心”?-钛媒体官方网站 微信、抖音双榜冲进畅销前十,这款休闲 RTS,藏着小游戏全新赚钱逻辑-钛媒体官方网站 “光伏豪门”内斗闹上法庭,母女“开撕”互提罢免-钛媒体官方网站 快手:老铁翻身,就靠 “可灵” 了-钛媒体官方网站 大厂全线押注AI编程,Vibe Coding掀起“全民造应用”浪潮-钛媒体官方网站 杀入固态电池赛道,5150亿钟睒睒再展“野心”-钛媒体官方网站 小红书为什么要买世界杯?-钛媒体官方网站 “真Agent”创业怎么做?这8个问题讲清楚了-钛媒体官方网站 AI出海企业如何保卫利润?营收管理背后的“钱”规则-钛媒体官方网站 我花59元,为了和陌生人一起吃饭-钛媒体官方网站 《浪姐7》不好看,都怪导演是男性?-钛媒体官方网站 A股存储大黑马:净利猛涨4943%,被韩国人抢疯了-钛媒体官方网站 GDP突破5600亿元,昆山,不只是“最强县”那么简单-钛媒体官方网站 大摩“网红”研报余音绕梁,PCB产业继续过春天?-钛媒体官方网站 大模型刷爆所有考试,却离AGI更远了:这篇论文拆穿了什么?-钛媒体官方网站 欧洲储能的“麻烦”-钛媒体官方网站 刚缓过劲,锂电隔膜又开始集体扩产豪赌了?|行业风向标-钛媒体官方网站 Edge AI Daily 早报(5月28日)-钛媒体官方网站 新能源电池相关指数基金深度解析-钛媒体官方网站 基金市场概况与资产配置观点 (05.18—05.24)-钛媒体官方网站 【钛晨报】李强最新调研:积极探索期货现货联动经营;长鑫科技IPO过会、立讯精密被罚、段永平增持泡泡玛特;宁德时代旗下公司与张雪机车高层正式开始接洽合作-钛媒体官方网站 价值判断:跌停板的投资机会和风险提示(5月26日)|证券市场观察-钛媒体官方网站 价值判断:涨停板的投资机会和风险提示(5月26日)|证券市场观察-钛媒体官方网站 业绩连降募资闲置,毛利率仅10%的“高科技”项目,柏诚股份“伸手”再要12亿-钛媒体官方网站 为什么科技行业越繁荣,岗位越少?-钛媒体官方网站 一个要第二曲线,一个要曲线上市:嘉戎技术与杭州蓝然的“双向奔赴”|并购一线-钛媒体官方网站 东华能源隐瞒仲裁近4年,引爆信披违规、9亿巨亏连环雷-钛媒体官方网站 业绩翻倍股价暴涨,鼎通科技狂飙背后,大客户依赖隐忧凸显-钛媒体官方网站 大厂还是放不下“买菜”生意-钛媒体官方网站 小米大模型永久降价99%,正面对标DeepSeek?-钛媒体官方网站 宇树利润越下滑,市场反而越看好?-钛媒体官方网站 自动驾驶技术竞争升级,VLA之后是什么?-钛媒体官方网站 独家对话光帆董红光:AI硬件的通解,不能光靠创业公司单打 氧化铝暴涨!几内亚铝土矿出口管制,对国内铝产业链真实冲击有多大?-钛媒体官方网站 Agent化的OS:拼的不是AI,是底盘-钛媒体官方网站 广告主“投币”已到账,B站终于不“用爱发电”了 PI3Kα抑制剂打开新大陆 60亿美金,填不满周永的神奇口袋 日赚上百美金的AI中转站,为何被抓?-钛媒体官方网站 100% AI电影亮相戛纳,7个人干300人的活,快手这次赢麻了-钛媒体官方网站 神经科学攻坚战,千亿市场往事与新局 对抗工业味,死磕“不可能三角”:鲜制零食能跑出下一个万店连锁吗? 小米亟待走出“等风来”的叙事逻辑 福耀玻璃:“汽车强国”背后的“卖铲人”-钛媒体官方网站 谷歌全家桶,都被新模型“污染”了 Two Listed Companies’ Related Transactions-钛媒体官方网站 摘“U”之后,奥比中光想做机器人产业的“水电煤” 拓日新能十年首亏之下,陷实控人家族内斗 下一个AI较量场,为什么是Harness? 别再惦记 SpaceX 的 IPO,眼下这两只新股更值得关注 魔法原子的全面战争-钛媒体官方网站 美克生能源:七年累亏10.6亿,经营性现金长期“失血”,刚融1.35亿再募资引争议|IPO观察-钛媒体官方网站 腾信精密:低研发撑起高毛利,不差钱仍大额募资|IPO观察-钛媒体官方网站 做宠物食品,已经很难赚到钱了?-钛媒体官方网站 压货80万,谷子店老板撑不住了-钛媒体官方网站 Coding拷问一切,独立大模型赛道的两年生死(下篇)-钛媒体官方网站 大瓶柠檬水扎堆上架,集体硬刚蜜雪冰城-钛媒体官方网站 从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度-钛媒体官方网站 【钛晨报】两项光伏组件强制性国标发布,规范安全要求杜绝功率“虚标”;AI短剧出海订单预计暴增5000%,不少企业正加码布局海外定制内容;三星成为韩国借款规模最大企业-钛媒体官方网站 Edge AI Daily 早报(5月27日)-钛媒体官方网站 英特尔及另外10只正在影响今日市场走势的股票-钛媒体官方网站 在SpaceX “星舰”升空后,Rocket Lab、AST等其他太空股应声大涨-钛媒体官方网站
在做Harness这件事上,DeepSeek更信搞量化的-钛媒体官方网站
字母AI · 2026-05-28 · via 钛媒体:引领未来商业与生活新知

文 | 字母AI

DeepSeek那张萌萌哒的招聘海报,相信你也看到了。

蓝色背景,卡通虎鲸,配上“Agent Harness研发工程师”几个大字,看起来像是哪个二次元公司在招实习生。但如果你真这么想,就错过了一个关键信号。

现在做Harness的公司很多,比如Anthropic的Claude Code,以及OpenAI的Codex。

这两个产品有个共同特点,领导者都是产品出身。

前者的创始人是鲍里斯·切尔尼(Boris Cherny),典型的产品经理,曾在Facebook做过工程和产品领导。

Codex这边是亚历山大·安布利克斯(Alexander Embiricos),Dropbox的产品经理。

但是DeepSeek不一样,这边Harness的负责人并不是什么产品经理,而是一个在Jane Street干了9年、后来联创量化基金TSY Capital的交易系统专家——崔添翼。

这个选择很反常识。一般公司无论做怎样的产品,找的都是懂用户体验、会画原型图、能协调需求的PM。

DeepSeek倒好,找了个会赚钱的量化高手。

但我却觉得DeepSeek反而做对了。

为什么?

因为量化交易和AI Agent的底层逻辑是一样的。

光有聪明的策略不赚钱,真正把策略变成钱的,是执行系统,是风控系统。

光有强模型也不够,真正把模型变成生产力的,是工具,是上下文。

DeepSeek不需要产品包装,也不需要向上管理,公司内部敞开天窗说亮话。

他们唯一需要的,就是跳过中间商,直接找个会赚钱的人,带着大家一起赚钱。

崔添翼其人

2008年,河南安阳一中的崔添翼凭借全国青少年信息学奥林匹克竞赛铜牌,被保送进入浙江大学计算机学院。那一年,梁文锋还在浙大信息与通信工程专业读研究生。

崔添翼在浙大的四年,几乎是在ACM竞赛的训练和比赛中度过的。他代表浙江大学参加ACM国际大学生程序设计竞赛亚洲区域赛,6次拿下金牌。

在那个年代,ACM竞赛圈里流传着一份讲义《背包九讲》,作者正是崔添翼。这份讲义系统拆解了动态规划中的背包问题,从01背包到完全背包、多重背包、分组背包、依赖背包,一直到泛化物品。至今仍在GitHub上更新。

2013年毕业后,崔添翼被Jane Street Capital香港分部聘为助理量化研究员,当时他的年薪就超过了百万人民币。

Jane Street是全球顶尖的量化交易公司,技术门槛高,面试流程严苛。

崔添翼在Jane Street一待就是9年,从事股票和固定收益领域的软件开发与研究。这9年里,他接触的不是单纯的算法题,还有真实的交易系统、风控系统、回测系统、交易管道和异常处理。

大家都说量化交易就是策略,你有了策略就能赚钱,但其实不是,光有策略是不能赚钱的。

一个策略在回测里表现再好,如果不能被稳定执行,价值接近于零。

真正把策略变成钱的,是执行系统。

策略写出来以后,一般不会立刻上真金白银,而是先放进历史行情里跑一遍,看它在过去那些涨跌里会怎么交易、最后赚不赚钱。这叫回测。但回测只是事后模拟,跑得漂亮不等于实盘也能赚钱。

系统得先看见价格怎么动,再判断要不要出手,接着把买卖指令送出去,还得盯着交易所回来的结果。“成交了吗?”、“成交价是多少?”

市场会突然暴涨暴跌,接口会延迟,数据会出错,策略也可能连续亏损。这时候系统必须知道什么时候停手,什么时候报警,什么时候把交易切断。

市场没人等你,延迟哪怕只有几毫秒,钱就没了。

这些东西不性感,也不会出现在学术论文里,但它们才是量化交易的核心竞争力。

2022年,崔添翼离开Jane Street,联合创办了量化交易机构TSY Capital,专注于全球股票市场的系统化量化交易策略。

从此以后,他就从打工人变成了创业者,他不仅要懂技术,还要从零搭建整套交易系统、组建团队、管理风险、对接市场。

TSY Capital的团队成员同样来自各大名校,但创业的现实比在大公司打工要残酷得多。2026年2月,有消息传出崔添翼离开了TSY Capital。

过了一段时间,他在LinkedIn上更新了自己的职位,加入DeepSeek Harness团队。

“又一个天才加入DeepSeek”这个事已经没啥新鲜的了,因为DeepSeek压根就不缺天才。

DeepSeek找来崔添翼,本身也不是让他过来训练模型的,而是为了让他搭建Harness。

对DeepSeek来说,其实Harness就是他们的交易系统。AI Agent的底层逻辑和量化交易是一样的。

光有强模型不够,真正把模型变成生产力的,是上下文管理、工具调用、终端执行、测试反馈、权限控制、失败回滚。

在量化里,不能被稳定执行的策略价值就是0。在AI里,不能安全操作文件、命令、代码的模型,也只是一个聊天框罢了。

崔添翼加入DeepSeek Harness团队的真正信号,是DeepSeek终于开始补那套把“聪明”变成“执行”的系统。

这是DeepSeek下半场的开局。

从模型效率到工作流入口

DeepSeek上半场的叙事,是模型效率。

V3、R1、开源、低成本、推理能力……

DeepSeek证明了一件事,中国团队就算没有那么多卡,也能做出全球级模型。打破了“只有美国大厂才能做强模型”的固有认知。

但是对于用户来说,永远都是谁出了什么新模型,我就跑过去用谁的模型。豆包超过DeepSeek的下载量,就是最好的例子。

模型爆红可以带来巨大的第一波流量,长期用户规模要靠产品、场景、运营和生态入口留住。字节的优势就在这里。

豆包有抖音、剪映、有SeeDance。DeepSeek虽说在模型社区里有声望,但在大众产品层面,它并没有形成豆包那种持续分发和高频使用能力。

当下半场模型能力趋同时,真正的竞争会从“谁的模型更聪明”,转向“谁离用户的工作流更近”。

虽然咱们习惯了ChatBot,可是对开发者来说,聊天框并不是入口,编辑器、终端、代码库、CI、文档、任务系统,这些玩意才是。

Claude Code和Codex这类的产品,也不只是“帮你写代码”,而是把模型嵌进开发者的日常操作路径。

谁占住这个入口,谁就拿到了付费场景。

很多人以为Harness的本质是模型性能,性能越强越好。实际上截然相反,Harness是让便宜token变得有用的系统。

Agent烧token是事实。

几年前,语言模型处理的还是很轻的任务,给它一段评论,让它判断情绪,几十个token,几乎瞬间返回。现在的编程Agent面对的是另一类任务,看完整个代码库,找到bug,写补丁,跑测试,再验证结果。

一次任务可能消耗上千万token、持续几十分钟,甚至几个小时,背后还得调用工具好几百次。

现在的GPT和Claude,本质上是Agent开着豪车送外卖,能跑通,但成本太高了。

便宜确实不是终点,问题是你至少得让我买得起,我才能舍得用吧?

而且哪怕是同一个模型,换一套Harness,结果就会完全不同。

X上有位叫做Sayash Kapoor的博主做了一个测试。

以Claude Opus 4.5为例,放进Claude Code的Harness,在CORE-Bench Hard上能达到95%。换成一个朴素的Hugging Face配置,成绩只剩42%。

同样的权重、同样的智能水平,单是Harness就拉开了53个百分点,这个差距还是挺明显的。

大家拼的已经不是模型了,而是谁的Harness更好。一个更小、更便宜的模型,只要配上优秀设计的Harness,也可能打败一个大模型加粗糙Harness。

这就是2026年所有头部大厂都在追求Harness的原因。你模型终究是要使用的。多买几张卡、多花点时间去训练模型,提升很小很小。但写好一个Harness,那简直是焕然一新。

AI编程已经过了“模型会不会写代码”的阶段,现在哪还有不会写代码的模型?

真正拉开差距的地方,就是模型能不能在真实的代码库里稳定干活。

Harness负责组织代码库、项目规则、上下文摘要,控制迭代次数、重试策略,把模型的决策转成shell命令、文件编辑和测试执行,再把测试失败、日志输出、浏览器截图重新喂回模型。

AI Agent是一个“思考、行动、反馈、修正”的长循环。这个循环能不能跑稳,靠的就是Harness。

API价格越低,单纯卖token赚的钱越少,这是无可争议的事实。

所以才要有Harness,去把低价的模型包装进高价值场景。

同样100万token,用在聊天里只是问答,用在代码Agent里可能完成一个bug修复、一次重构、一个功能原型。后者的付费意愿高得多。

DeepSeek需要从卖模型调用,转向卖工作流结果。这是下半场的核心逻辑。

DeepSeek的短板

DeepSeek网页端很火,APP下载量也很高,但关于模型调用这块,它是没有收集渠道的。别人用它的模型跑agent,反馈信息不回梁文锋那里。

这不是技术问题,这是机制问题,网页端和APP都是ChatBot,并不能真正去跑工作流。

要想去做Harness产品,你得有一个收集反馈的通道。用户在哪里卡住了?哪些工具调用失败率最高?哪些场景下模型表现不稳定?

这就像一家量化公司把策略发出去了,但交易日志、成交回报、风控记录都在别人手里。你知道策略有人用,却不知道它到底怎么赚钱、怎么亏钱。

收集不到这些信息,产品就是闭门造车。

Harness最值钱的地方,恰恰就在失败日志上面。

它改错了哪一行?跑测试时挂在哪个报错?终端命令为什么失败?它有没有重复读同一个文件?有没有在上下文快满时开始忘事? 

拿到更多真实失败日志,谁就能更快知道Agent到底差在哪里。

Claude Code为什么能在短时间内占到GitHub公开提交量的4%?因为Anthropic不只是做了一个工具,而是建立了一个完整的反馈循环。

它把用户的每一次失败和重试,都会变成产品迭代的数据。尤其是那些集中错误,直接变成了Claude Code的新Harness。

DeepSeek现在要补的,不只是Harness本身,还有这套收集反馈、快速迭代的机制。

量化里有个词叫滑点。你以为自己能在这个价格成交,结果真下单的时候,价格已经变了,中间差出来的就是滑点。 

Agent里也有滑点。模型以为自己理解了项目结构,结果读错文件;以为一条命令能跑通,结果环境变量没配;以为补丁改好了,结果测试挂了。 

这些差距,就是模型从“想明白”到“做成事”之间的滑点。Harness的价值,就是把这些滑点一点点压低。

还有一点,现在Agent有一个特别让人头疼的问题就是“管不住”。

2026年4月,汽车租赁SaaS公司PocketOS,让一个运行在Cursor里的Claude Opus 4.6编码Agent,通过Railway调用一次API,结果这个Agent在9秒内删除了公司的生产数据库和同卷备份,公司最后只能从三个月前的备份恢复。

在量化公司,最怕的不是策略不赚钱,而是策略失控。亏钱可以复盘,失控会把公司拖死。所以交易系统一定要有风控:亏到什么程度要停,出现异常报价要停,接口延迟太高要停。 

Agent也一样。它能读文件、改代码、跑命令,能力越大,风险越大。什么命令不能执行,哪些目录不能碰,什么时候必须问人,改坏了怎么回滚。 

崔添翼值钱的地方在于,他知道什么时候该把模型摁住。

以前在产品体验这件事上,DeepSeek是不太需要操心的。模型够强,开源够快,社区自然会来。

现在不一样了。开发者对编程工具的容忍度是极低的,因为他们有些人会同时准备很多个编程工具,A工具不行就马上换B工具。

Ivern AI在2026年4月开发者调查中提到,73%的开发者经常使用2个以上AI编码工具,只有27%只用一个工具。

除了产品体验以外,工具生态也是一个大问题。

Claude Code背后有MCP协议、有插件系统,还有各类的Skills。这些东西不是一天建成的,是在无数次的真实使用场景里长出来的。

稳定性是另一个痛点。DeepSeek爆红之后,服务器压力暴增,就比如5月28日,DeepSeek就又崩了。

对聊天用户来说,等几秒钟还能接受。但对编程Agent来说,稳定性就是生命线。任务跑到一半,你突然告诉我说API超时了,那所有工作都前功尽弃了。