惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

莫尔索随笔

Vol.103 Agent工程化落地周:工具走出IDE,组织面临重构 | 莫尔索 Vol.102 语音AI迈向核心交互界面,模型与工程实践深度解析 | 莫尔索 Vol.101 AI次方变革:组织中年撞上技术青春期,Harness Engineering与Agent系统重塑工程范式 | 莫尔索 Vol.100 Agent走向生产:GPT-5.5、DeepSeek V4、Kimi K2.6与智能体基础设施爆发 | 莫尔索 Vol.99 AI智能体基础设施全面升级与模型能力边界扩张的行业新动态 | 莫尔索 Vol.98 AI领域精选话题解析:从技术发展到应用实践全面解读 Vol.97 AI领域前沿动态:从智能体工程化到开源模型演进 Vol.96 AI智能体架构演进:从OpenClaw到Paperclip的编排实践 Vol.95 AI智能体技术架构与开源框架深度解析:从OpenClaw到LangChain | 莫尔索 Vol.94 AI智能体与消费级应用趋势:GPT-5.4、OpenClaw与Agent工程化实践 | 莫尔索 Vol.93 AI领域深度洞察:从智能体演进到设计变革与人生战略 | 莫尔索 Vol.92 AI行业周报:融资突破、伦理冲突与智能体革命深度解析 Vol.91 AI前沿洞察:智能体革命、编程范式转移与商业变革深度解析 | 莫尔索 Vol.90 2025年AI领域深度盘点:自动驾驶、Agent技术、硬件趋势与商业变革 Vol.89 AI领域前沿洞察:从编程范式变革到太空部署与伦理挑战 Vol.88 2026年AI全景解析:大模型、Agent、开源生态与中美竞争格局 Vol.87 AI领域2026年趋势:智能体爆发、SDD编程、开源模型与商业变现深度解析 Vol.86 AI领域前沿洞察:Agent技术、视频生成、模型优化与商业应用精选 Vol.85 AI领域深度洞察:从Agent爆发到工程实践,探索大模型时代的发展路径 Vol.84 2025-2026年AI领域趋势总结:Agent落地、多模态爆发与创业机会深度解析 Vol.83 AI领域深度洞察:组织变革、Agent落地、技术趋势与投资策略全解析 Vol.82 AI领域年度盘点:Agent技术、世界模型与增长策略深度解析 | 莫尔索 Vol.81 2026年AI行业趋势预测:垂直领域、世界模型与智能体工程深度解析 | 莫尔索 Vol.80 AI领域前沿洞察:从创业案例到技术演进,解析AI应用与未来趋势 Vol.79 AI领域精选:大模型竞争、Agent应用、图像生成与投资趋势深度解析 Vol.78 AI领域精选文章深度解析:从技术突破到商业落地全视角 | 莫尔索 Vol.77 AI领域精选文章深度解析:从创业增长到技术架构全面洞察 | 莫尔索 Vol.76 AI Agent落地挑战与策略:2025年企业部署实战经验解析 | 莫尔索 Vol.75 2025年AI领域十大核心趋势:从AGI使命到Agent工程实践深度解析 | 莫尔索 Vol.74 2025年AI大模型与Agent技术发展全景:趋势、应用与挑战 | 莫尔索 Vol.73 AI Agent技术演进与落地实践:从工具链到上下文工程全解析 | 莫尔索 Vol.72 AI医疗平权与Agent技术:京东健康AI医院与多智能体协作解析 | 莫尔索 Vol.71 AI领域精选文章总结:智能体开发、模型优化与商业应用 | 莫尔索 Vol.70 AI领域精选文章总结:从GTM策略到智能体应用与前沿技术 | 莫尔索 Vol.69 AI创业与编程智能体发展:从点子到实践的全方位解析 | 莫尔索 Vol.68 AI领域深度解析:大模型、智能体与创业趋势全览 | 莫尔索 Vol.67 2025年AI行业全景:技术突破、应用趋势与资本动向深度解析 | 莫尔索 Vol.66 AI领域洞见:Agent趋势、投资赛道与安全挑战深度解析 | 莫尔索 Vol.65 AI Agent技术前沿与创业策略:企业应用、手机端创新与安全挑战 | 莫尔索 Vol.64 AI领域深度解析:从科研工具到商业模式的全面探讨 | 莫尔索 Vol.63 GPT-5发布:AI领域的新里程碑与未来展望 | 莫尔索 Vol.62 AI领域深度解析:从大模型到智能体的技术演进与商业应用 | 莫尔索 Vol.61 阶跃星辰发布Step 3模型:推理效率创行业新高 | 莫尔索 Vol.60 AI时代数据商业模式与中美差异深度解析 | 莫尔索 Vol.59 Grok 4多模态AI模型:性能、争议与API定价解析 | 莫尔索 Vol.58 AI领域创新与挑战:从模型优化到应用落地 | 莫尔索 Vol.57 AI领域精选文章:从技术突破到创业策略的全面解析 | 莫尔索 Vol.56 AI Agent 进行时!OpenAI智能体指南发布,MiniMax 发布 Agent | 莫尔索 Vol.55 决定AI产品成功的隐藏指标 | 莫尔索 Vol.54 什么是 NLWeb | 莫尔索 Vol.53 如何让 Agent 规划调用工具 | 莫尔索 Vol.52 面向 AI 产品的智能体评估指南 | 莫尔索 Vol.51 AI 智能体商业落地的现状与真相 | 莫尔索 Vol.50:Evaluation is all you need | 莫尔索 Vol.49:大模型时代的表格数据挖掘 | 莫尔索 Vol.48:AI 发展开始进入下半场 | 莫尔索 Vol.47:workflow 与 Agent 方案如何选择? | 莫尔索 Vol.46:智能体工具调用 API 与 GUI 的差异和融合 | 莫尔索 Vol.45:Anthropic MCP 当前还有哪些不足? | 莫尔索 Vol.44:模型即产品的技术实现路径 | 莫尔索 Vol.43 什么样的 Agent 会在 2025 年脱颖而出? | 莫尔索 Vol.42:AI Agent 如何颠覆传统的外包行业? | 莫尔索 Vol.41:DeepSeek R1爆火之后,到底什么任务适合用 RL 做? | 莫尔索 Vol.40:Grok3 是否意味着预训练阶段 Scaling Law 已失效? | 莫尔索 Vol.39:从 DeepSeek R1 看 Scaling Law 的未来 | 莫尔索 Vol.38:关于 DeepSeek 的误读与真相 | 莫尔索 Vol.37:2025 年 AI 编码类产品将如何演进? | 莫尔索 Vol.36:YC 回顾 2024 年 AI 行业创业生态 | 莫尔索 Vol.35:2024 年大模型领域的发展趋势和竞争格局全面回顾 | 莫尔索 Vol.34:对OpenAI o3模型的看法、思考与反思 | 莫尔索 Vol.33:为什么视频生成模型比文本生成模型发展速度更快? | 莫尔索 Vol.32:AI Creativity 赛道有哪些机会? | 莫尔索 Vol.31:AI Native 应用长什么样? | 莫尔索 Vol.30:什么是Agentic RAG? | 莫尔索 Vol.29:可视化呈现RAG的工作过程 | 莫尔索 Vol.28:从物理定律看视频生成离世界模型还有多远? | 莫尔索 Vol.27:如何定制 LLM 以更好地服务于特定领域的企业? | 莫尔索 Vol.26:AI Agent 应用、商业化以及当前行业的现状 | 莫尔索 Vol.25:AI像人一样使用计算机可信吗? | 莫尔索 Vol.24:实测可灵、Luma、Runway 等13个视频生成模型,哪个更好? | 莫尔索 Vol.23:为什么大语言模型仍无法做到真正的推理? | 莫尔索 Vol.22:垂直 SaaS 如何通过 AI 来提高收入? | 莫尔索 Vol.21:OpenAI o1合成数据与推理搜索 | 莫尔索 Vol.20:如何评估 Embedding 模型? | 莫尔索 Vol.19:AI应用正在这4个大场景里加速落地 | 莫尔索 Vol.18:大模型是泡沫吗? | 莫尔索 Vol.17:如何构建生成式 AI 应用平台? | 莫尔索 Vol.16:构建可靠 LLM 应用的三大原则 | 莫尔索 Vol.15:大语言模型应用如何实现端到端优化? | 莫尔索 Vol.14:如何改进大模型代码生成能力? | 莫尔索 Vol.13:如何验证模型是否被测试集污染? | 莫尔索 Vol.12:RAG 在企业落地中的挑战 | 莫尔索 Vol.11:AI 应用爆发何时到来? | 莫尔索 Vol.10:大模型提取表格信息(TIS)的能力究竟如何? | 莫尔索 Vol.9:构建 AI 产品过程的踩坑经验总结 | 莫尔索 Vol.8:如何针对 GPT-4o 语音模式进行越狱攻击? | 莫尔索 Vol.7:如何利用大模型解决传统行业的老问题? | 莫尔索 Vol.6:如何将 AI 模型转化为生产环境中的产品? | 莫尔索 Vol.5:面向企业的大模型应用算一个新赛道吗? | 莫尔索 Vol.4:DeepSeek-V2搅动市场,大模型价格战已拉开序幕? | 莫尔索
Vol.104 自动化加速,人类专家价值飙升:AI Agent工程体系化与产业变革 | 莫尔索
2026-05-24 · via 莫尔索随笔

⼤家好,Weekly Gradient第 104 期已送达,本期内容聚焦AI自动化加速下人类专家价值上升的悖论,涵盖Gemini 3.5、Qwen3.7-Max等模型突破,Agent工程体系化(记忆、梦想、对抗式评估),以及AI原生创业与硬件趋势。

AI 商业

聚焦 AI 行业的商业化路径、市场竞争格局和商业模式创新,包含投资趋势、GTM 策略、SaaS 转型等商业话题。

1.AI 硬件浪潮才刚刚开始:来自 Apple、Meta、OpenAI 一线的产业判断(Lenny’s Podcast)

AI硬件可不是简单的耳机或眼镜,一场由苹果、Meta和OpenAI内部人士参与的对谈,直接抛出了不少硬核判断:具身智能会比想象中更快落地,终端侧推理才是让设备真正聪明的关键,硬件形态也在快速演进。别被那些虚头巴脑的趋势分析带偏,听听一线操盘手怎么拆解,能帮你更清醒地看清AI硬件接下来的牌局。

2.当软件容易被创作,新时代的产品长什么样? | 对谈 Albert(42章经)

这期42章经和Albert聊了个很实在的话题:当AI让写软件变得跟说话一样简单,创业空间到底在哪?他们提到模型厂商正在挤压创业者的生存空间,团队两个月试了几十个项目,最后发现真正的机会可能不在技术本身,而是品牌溢价、长尾消费和平台型产品。Albert的新产品merging.live就是给新一代maker提供反馈和连接的地方。如果你关心AI创业、vibe coding或者独立产品怎么做,这期很值得听。

3.创始人手册:打造 AI 原生初创公司(宝玉的分享)

如果你正在或打算进入AI创业领域,这本创始人手册就像一本实战地图。它从团队搭建、产品策略到工程实现,给出了整套可落地的框架,而不是零散的观点。无论你是技术背景还是初次创业,都能找到自己的定位和下一步行动指南。

AI 产品

探索 AI 原生产品的设计范式与用户体验革新,强调产品哲学、交互模式、Agent 产品设计等。

1.Gemini 3.5:具备行动能力的前沿智能(DeepMind Blog)

DeepMind 最新发布的 Gemini 3.5 Flash 真的太顶了!它不只是个聪明的大脑,还能动手干活——在代理和编码任务上表现炸裂,处理复杂长期任务又快又便宜。现在已经有个人 AI 助手和企业方案在用,感觉智能代理的黄金时代真要来了。

2.Introducing Composer 2.5 · Cursor(Cursor Blog)

Cursor 终于发布了 Composer 2.5,作为 AI 编码领域的头部产品,这次更新带来了代码助手能力的显著升级。如果你想第一时间了解新版本的能力边界和产品方向,这篇文章来自官方博客,信息量直接且关键。

3.Notion 创始人 Ivan Zhao:重塑公司的艺术(Sequoia Capital)

Notion 创始人 Ivan Zhao 分享了一套很酷的公司管理哲学:把组织变成爵士乐队,让每个人高度自治、即兴创作。他还提到 AI 产品开发要从‘造桥’变成‘酿酒’,意思是别硬规划,要慢慢发酵。最有趣的是‘杠铃式人才模型’——一边是极少数资深专家,一边是大量灵活执行者,中间层被 AI 替代,就像用 AI 当‘结构钢’来保持公司既大规模又敏捷。

AI 工程

涵盖 AI 工程技术实现与场景化开发的全流程,包含 Agent 工程架构、工具实践、上下文工程等核心技术话题。

1.选择正确模型:LLM Evals 与优化的数据驱动指南(Claude)

别再迷信公共基准了,你的业务场景和别人的不一样。这篇指南手把手教你搭建自己的评估框架,怎么选模型、怎么优化,全看数据说话。还有杀手锏——提示缓存和上下文工程,能省下不少成本还提升推理准确性,挺实用的干货。

2.Qwen3.7-Max 重新定义 AI Agent 基座(通义大模型)

Qwen3.7-Max在多个权威评测中拿到国内第一,最硬核的是它通过了35小时连续自主执行、1158次工具调用零中断的极限测试,长程智能体的稳定性和深度推理能力让人印象深刻。这篇博文把它的核心亮点和复杂任务中的工程实践讲得很透,如果你正在找靠谱的智能体方案,里面有不少实打实的参考。

3.Google Cloud 在 I/O ‘26 上为智能体开发者带来的新动态(Google Cloud Blog)

Google Cloud 在 I/O ‘26 上亮出了智能体开发栈的四层架构:Agent Studio、Managed Agents API、Antigravity 2.0 和 ADK 2.0。如果你正在纠结从哪个层级入手,这篇文章给你提供了一个从低代码到代码优先、从快速试验到工程治理的选择框架,能帮你和团队快速定位最适合的切入点。不管你是刚接触智能体还是已有工程体系,都能从中找到自己的位置。

4.用于自学习自主 Agents 的 Memory 与 Dreaming(Claude)

Anthropic 给自主 Agent 加上了两个新技能:记忆和梦想。记忆就像个虚拟文件系统,让 agent 能随时调用知识;梦想则像脱机优化循环,全局统筹记忆状态。两者结合让 agent 持续自我改进——Rakuten 用这套方案后,首次执行错误率狂降 97%,企业自动化效率飞升。

5.构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成-评估架构(AI Engineer)

Anthropic工程师在AI Engineer大会上分享了一个超实用的干货:怎么让智能体稳定运行几个小时?他们搞了个“对抗式生成-评估”架构——用一个模型专门挑另一个模型的刺,这样在长任务链中质量就不容易崩。这可是目前生产级Agent最头疼的问题之一,一手经验加架构拆解,读起来很过瘾。

6.别构建垃圾:AI 智能体成熟度的四个层级(AI Engineer)

别被那些花里胡哨的智能体叙事骗了——Ara Khan 的分享直接把你拉回工程现实:状态机、提示词剪枝、集成循环、架构边界和云端部署,全是硬仗。他提出的四级成熟度框架和看板式并发管理,对正在从原型往生产爬、害怕堆出“智能体垃圾代码库”的团队来说,简直是救命指南。

7.重新定义 Skill 开发:保姆级教程&一站式开发助手发布(阿里云开发者)

如果你正在做 Agent 或 Skill 开发,这篇就是为你量身定制的补课材料。它不像那些只讲概念的泛泛而谈,而是从触发规则、目录结构到写作规范,一路打通发布、调试和跨平台迁移。更棒的是,它把版本管理、热加载、评测这些工程痛点串成一条完整流水线,还附带了 skill-dev-aio 这个一站式工具。读完你就能把个人经验变成可复用的 Agent 能力,少走不少弯路。

8.从 0 开发大模型的 17 种 Agent 架构演进详细拆解(腾讯技术工程)

如果你在搭建大模型应用时对Agent架构如何选型感到头秃,腾讯技术工程团队这篇从零开始的拆解简直救星。他们梳理了17种Agent架构的演进路线,从最简单的单步执行到复杂的多智能体协作全覆盖。和那些泛泛而谈的文章不同,这篇真的聚焦工程实现,直接告诉你每种架构适合什么场景、有哪些坑。开发者朋友们可以拿来当架构设计参考手册,挺实在的。

9.CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘(InfoQ 中文)

如果你正在用AI编码工具,但发现程序员们花大量时间修修补补AI生成的代码,那这篇文章能解释你的困惑。InfoQ这篇复盘戳破了一个流行假象:AI生码率高不等于提效。CIO们开始意识到,只看代码生成量反而会让研发团队陷入虚假繁荣。文章提供了更务实的评估框架,帮你真正衡量AI对生产力提升的实际贡献。

10.将 AI 用作大规模工程系统的思考伙伴(InfoQ)

这篇文章把AI定位成资深工程师的思考伙伴,不是取代你,而是帮你扮演讲故事里的五个角色:考古学家(挖出历史代码的上下文)、实验者(快速模拟设计方案)、评论家(挑出漏洞和逻辑矛盾)、合著者(一起写代码和注释)和审阅者(自动查错)。听着很理想?但作者很清醒:AI能加速大量机械劳动,但在关键判断、项目级理解和直觉上,你才是不可替代的那个。如果你是写大规模系统的老手,这里有个新视角——把AI当成团队成员,而不是工具。

其他

行业前沿与开源生态,整合行业深度洞察与开源技术动态的复合型主题,技术哲学、AGI 讨论、领袖观点。

1.Erdős 突破:OpenAI 模型首次实现重大 AI 数学发现(OpenAI)

OpenAI的AI模型刚刚在数学界搞了个大新闻——它首次独立解决了一个组合几何领域的长期难题,这可是AI自己发现规律并证明的,不是简单算算数。以前大家觉得AI顶多是个运算工具,现在它开始真正做科研了,从辅助变成自主发现,这转折点意义重大。别以为这只是数学圈的事,这种能力一旦成熟,工程、物理、生物各种基础科学都可能被AI捅出新洞见。关心AI怎么改变世界的人,这篇值得细看。

2.自动化之后(Every)

AI把很多技能变得廉价,但人类专家的价值反而更高了?这篇文章用「框架」和「芝诺悖论」来解释,为什么我们总能在AI逼近时设定新基准。关键在于「能动性」——给自己设定目标的能力,这是AI代理做不到的。如果你担心被取代,这篇会让你看到自己的不可替代性。

3.谷歌 AI 的 14 年、Gemini 翻身之战,与视觉理解模型:专访 DeepMind 前核心科学家 Andrew Dai|Neolabs 特辑(硅谷101)

一位在谷歌AI待了14年的核心科学家Andrew Dai,不仅启发过OpenAI的GPT,还主导了Gemini的翻身仗,最近离职创办了Elorian AI,专注语言和视觉推理,一出手就融了5500万美元。这篇文章和他聊了聊谷歌AI的发展史,以及Neolabs在AGI探索上的新思路,信息量很大,值得一读。