惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

InfoQ - 促进软件开发领域知识与创新的传播

OpenTofu 1.12发布,带来 Terraform 从未提供的功能 人工智能无法加速软件交付 C++之父开撕AI Coding:资深开发者宁愿退休也不愿伺候AI生成的代码 Java近期资讯:OpenJDK JEP、Azul Payara、WildFly、LangChain4j、OpenXava和Google ADK 模型之外,皆属Harness!DeepSeek终于出手:招人、组队、从零造一个中国版Claude Code AI时代数据面临的新挑战和解决之道|AICon上海 数字银行Monzo在100个团队与12000个dbt模型之上构建可治理的数据网格 破局多端困境,拥抱 AI 变革:飞猪跨端技术的过去、现在与未来|AICon上海 大规模工程支撑场景下的多智能体系统设计:Grab 实践案例 OpenAI 详解规模化低延迟语音 AI 的 WebRTC 架构 华为鸿蒙突击队编程框架首席技术专家谢国确认出席AICon上海站,并以鸿蒙为例分享AI 时代的跨平台框架演进 买了卡不等于买到生产力:企业 Token 焦虑,逼出 AI Infra 新战场 Anthropic 推出 MCP 隧道,供私有代理访问内部系统 Agoda 构建多模态内容系统,链接图片和评论 别再骂 Claude 限速了,Anthropic Boris 亲口承认:最挑剔的用户,反而最离不开我们 为创造,再一次信仰之跃 |AdventureX 2026 开启招募 GitHub面临生存之战!多位员工曝内部乱象:独立文化要没了,封杀Claude Code才能“活” AI Coding 很强,为什么企业没提速? Gemini 3.5深夜登场,谷歌CEO劈柴亲自算账:速度快4倍、一年还省超10亿美元,曝内部已被颠覆 中经社发布“十五五”新产业研究智能体,可自主生成产业链分析报告 虚拟上下文窗口技术实现10倍扩容,联想天禧AI 4.0破解大模型长程推理难题 千问云发布,阿里云将模型路由、认证、用量查询全面 CLI、SKill化 TanStack 披露一起复杂的 npm 供应链攻击事件, 42 个包遭入侵 Vite 8.0 :基于 Rust 的统一打包工具,构建速度最高提升 30 倍 Fonttrio 发布:面向 shadcn/ui 的开源字体搭配注册表 Pip 26.1正式发布:上线依赖冷却机制与实验性锁定文件功能,抵御供应链攻击 阶跃星辰副总裁俞刚确认出席AICon上海站,分享多模态生成与理解的架构演进 Cloudflare 发布 Dynamic Workflows,将持久化执行扩展到按租户与按 Agent 动态运行的代码 每个企业都需要自己的 Token Factory?超聚变提出“智企”新范式 Navigation API 达基线版本,已经可以作为 History API 的替代方案使用 Cloudflare与Stripe推出新协议,让AI智能体创建账号、购买域名和进行生产部署 词元时代,万物智能 | 摩尔线程2026产品发布会:打造全场景AI算力基石 Altman拿Token换股权只够烧45天,20亿Token捐母校只值100块:Token真成“钱”了,谁更赚? 马斯克要当“太空版黄仁勋”:Anthropic一年上交150亿美元,Cursor百亿分手费锁死,SpaceX成新算力庄家 中国最神秘AI孵化器正式亮相:11位“大佬”导师成为超强外挂 从兼容 CUDA 到自我进化,摩尔线程想用 MUSA 解决真正的难题 OpenAI开源Symphony:面向自主编码智能体编排的SPEC规范文档 Ubuntu拥抱本地AI,而非云优先的操作系统集成 企业级Agent 落地,绕不开的 4 个工程问题 微软发布Aspire 13.3,迎来部署与前端重磅更新 腾讯混元世界模型的研发布局与思考|AICon上海 阿里发布新一代千问旗舰模型Qwen3.7-Max,登顶最佳国产模型 谷歌推出Cloud Fraud Defense,作为reCAPTCHA的继任者 AI Agent 最大的问题:它在企业里只是个“无名之辈” | 技术趋势 Cloudflare 推出支持确定性执行和 5 万个并发工作流的 Workflows V2 对话灵感实验室:全帧率 VLM、低成本与分层部署,业务现场不止需要炫技模型 10 天 3000 元,一人造出全球 AI 爆款!好莱坞导演抢人、游戏版引爆期待,合作细节首次披露 Anthropic 推出 Routines for Claude Code Snowflake Intelligence 合作伙伴生态:把 AI 能力带入千行百业 |技术趋势 一个隐蔽的循环依赖如何导致了 Discord 3 月份的语音服务中断 Arm 携手通义实验室,发起手机上的创意 AI 挑战赛 基准测试表明:AI智能体可修复独立漏洞,却难以理解系统范围影响 CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘 外行式 Vibe Coding 正跟专业的Agent 工程走向融合:最吓人的是,我们“摆烂”有正当理由了? 不换 Kimi 底座,1/10 成本追平 Opus 4.7?Cursor 用 Composer 2.5 反击 Claude Code Snowflake Intelligence:从回答问题到执行任务的个人工作 Agent | 技术趋势 SolidJS 2.0 Beta:一级异步支持、重构的Suspense与确定性批处理 训推一体潮汐弹性:蚂蚁集团在智算基础设施的池化调度实践|AICon上海 如何在软件组织中扩展社会化的系统 Moonrepo发布moon v2.0:引入WASM插件工具链并重构CLI 蜂群Agent来了!openJiuwen社区发布JiuwenSwarm,引领Coordination Engineering新范式 Pinterest 工程师消除 CPU 僵尸进程,解决生产环境瓶颈 AMD苏妈对话李开复:AI转型只能由CEO驱动、未来“DRI”(直接负责人)将是企业核心|直击现场 8大岗位AI技能图谱 Anthropic发布工程事故报告,说明六周来Claude Code质量下降源于三项产品调整 05·29 腾讯云「数据库+AI」产品发布会重磅启幕 Airbnb 采用基于上下文的身份识别模型,支持隐私优先的社交功能 Anthropic首次揭秘下一代Claude怎么造!用户吐槽直接喂模型,连AI“做梦”都被训练 消息积压方面的数学知识:用于队列恢复的容量规划 Netflix借助Apache Druid中的区间感知缓存让84%的查询结果直接命中缓存 小红书 vibe coding 平台(Muse)之高可用人机共创 Agentic 系统架构实践|AICon上海 时序存储:影响成本与性能的设计选择 Cangjie:一门新的开源编译型语言,原生支持效应处理器和代数数据类型 Snowflake Observe:可观测性与 AI 数据云的融合 | 技术趋势 Golden Question 征集令|把你的 AI 落地之问带去 Snowflake Summit 26 H200还没到中国,Anthropic先急了:千亿美元抢芯片,转头涨价让开发者买单 曝Kimi 后训练团队研究员离职,曾为K2.5贡献者;MiniMax最新招聘,兼职也拿期权;传蜜雪CEO隔空回复黄仁勋,“大佬同款”卖爆|AI周报 从第一性原理出发:那些构建 Snowflake 的理念,以及下一步走向 | 技术趋势 Coder Agents让企业能够在自托管基础设施上运行AI编码工作流 超越基准:采用基于指标的方法在真实设备上维持iOS长期的良好性能 Java新闻汇总:GraalVM、Spring AI、JobRunr、GlassFish、Grails、Groovy和Quarkus Agent MCP 一个二十多年老兵的忧心:那条从Debug开始走向资深工程师的路,正在崩塌 从 Vibe Coding 到需求托管交付 Agent,菜鸟 AI 研发效能实践|AICon上海 从批处理迁移到微批次流式处理的实战经验 AI 的“最后一公里”:本地执行与全场景硬件接入的下一代 Agent 中枢|AICon上海 ChatGPT 可以帮你理财了,但它也知道你的全部余额!用户:谢谢不用了 记忆感知的大模型 KVCache 优化|AICon上海 Kubernetes v1.36 发布:安全默认配置强化,AI 工作负载支持日趋成熟 百度想明白了:旧供给到达极限了 “一人公司”正在重做AI创业?极客部落首场16个OPC项目路演:AI 创业已从“卷模型”转向“卷闭环” 当AI助手进化为自主智能体:英伟达如何携手 SAP 重构企业级“信任逻辑”? JEP 533 加强 JDK 27 中 Java 结构化并发的异常处理 兼顾效率、成本与能力,百灵开源旗舰推理模型 Ring-2.6-1T Grafana Pyroscope 2.0:实现持续性能分析规模化落地 AdonisJS v7 推出端到端类型安全、经过重构的项目模板以及零配置 OpenTelemetry Anthropic 推出 Claude Platform on AWS 鼠标每动一下都在训练AI,Meta员工“造反”了:厕所、会议室都贴满抗议传单 GitHub 推出 MCP 服务器集成,全面扩展机密扫描功能 蚂蚁灵波开源LingBot-VLA真机后训练全流程代码,150条示教数据即可适配新机器人 科大讯飞面向超大规模教育场景的 Agent 系统架构演进与工程实践|AICon上海
Copilot 创始工程师:大多数 AI 编码“就像开着法拉利去买牛奶一样”
Darryl K. Ta · 2026-05-25 · via InfoQ - 促进软件开发领域知识与创新的传播

GitHub Copilot 创始工程师 Neel Sundaresan 正在构建 IBM Bob——一款智能编码工具,目前已有 8 万名 IBM 开发者在使用。

Neel Sundaresan 回避了三个问题,其中一个是 “IBM Bob 为什么取名叫 Bob”。

这种回避本身就耐人寻味。Sundaresan 现任 IBM 软件部自动化与 AI 总经理,也是微软 GitHub Copilot 创始工程师,早年还曾担任 IBM 研究员,并不是一个擅长做产品营销的人。他是研究员出身,后来成为产品构建者,再后来成为高管,贯穿这三个角色的始终都是同一个执念:究竟是什么在阻碍软件开发者提高效率,又该如何消除这些障碍?

他从 2000 年就开始研究这个问题,远早于 Transformer 架构和大语言模型的问世,也远早于 AI 与开发者工具被主流技术圈关联在一起。从那时候起,到已在 IBM 内部为 8 万用户提供服务的 IBM Bob 正式发布,这条探索之路远比发布会新闻稿所呈现的要漫长得多。

在无人关注的时候开始

Sundaresan 为提升开发者效率所搭建的第一个系统和如今我们熟知的 AI 编码工具截然不同。那是一个 API 调用推荐系统。

“开发者有 30% 的代码都是 API 调用,”他在接受《The New Stack》深度访谈时表示。“当你在一个类名后面按下点号,就会弹出一长串可供调用的函数,你得从中挑选一个。这本身就是一个效率损耗点。”

目标并不是生成代码,而是在恰当的时机给出正确的函数调用,本质上是开发者代码自动补全场景的搜索排序问题。

当时的模型不是 Transformer,甚至从现在的定义来看,也不是深度学习模型。但他表示,开发者们很喜欢这个工具。这个早期的启示——在开发流程里某个细微的环节降低使用阻力就能收获超乎预期的用户满意度——直到如今,仍在影响着 Sundaresan 对这类问题的思考逻辑。

“编码是一项分析性工作,和网购不一样,”他说。“如果系统给出了错误的推荐,或是给出会干扰我思路的推荐,那就有问题了。”

他认为,用户体验和底层 AI 的实现逻辑是两个相互独立、互不干扰的问题。即便模型性能再好,如果表层产品体验设计出现偏差,整体产品体验也会大打折扣。

他见证了模型领域的演进:长短期记忆网络(LSTM)、早期的编码器解码器架构、谷歌的 Transformer 论文,以及初代 GPT。在每一个发展阶段,他的团队早已明确了所要解决的问题,只是当时的模型还不够强大。“如果你回看我们发表的论文,这些相关领域我们都有涉猎,” Sundaresan 说道,“每篇论文都会提到哪种模型适合解决这类问题、哪种模型适合解决那类问题。”

当前沿模型终于具备了足够的能力,足以支撑更大投入并获得回报时,Copilot 应运而生,他说道。但到那时,Sundaresan 也已经花了多年时间观察模型会在哪些场景出现问题——以及围绕模型的产品设计会在哪些环节出现疏漏。陈旧的训练数据会导致模型生成看似笃定却虚假的信息。无论任务是否需要,都倾向调用性能最强、成本也最高的模型。在企业受限的运行环境中部署高性能模型也存在不小难度。

“就连我们的客户也不放心把数据发送到我们的云端,”他谈及在微软的早年经历时说道,“他们希望数据留在客户端。所以我们让模型直接在个人笔记本上运行,还为此投入了大量工程优化工作,确保它能在笔记本有限的资源条件下顺畅运行。”

为什么是在 IBM?

当 Sundaresan 讲述这段历史时,一个显而易见的问题是:他为什么把多年积累的知识带到了 IBM,而不是某个更光鲜的地方。他直言不讳:在微软待了十年后,他想换个环境,而 IBM 给出了一个很有说服力的理由。

但还有一个不那么显而易见的答案:对于他所研究的问题,IBM 的所谓“劣势”实际上是“优势”。

“仅软件部门,我们就有近两万名员工。我们有完善的基础设施与咨询业务,IBM 内部本身就有大量用户,”他说道。“如果我能打造出让他们受益的产品,这本身就是一个体量巨大的产品。”这种内部部署模式——IBM 称之为“零号客户”——给了他任何外部产品发布都无法提供的东西:一个规模庞大、多元且愿意容忍早期产品缺陷、换取实际效率提升的固定用户群体。

另一个优势在于工作负载的多样性。IBM 内部的开发者不仅编写 Python 和 Rust 代码,还会使用 PL/I、COBOL、大型机 JCL,还有被 Sundaresan 形容为“如同行业俚语一般的自定义语言”。只要 Bob 能够适配这么广的技术范围,就能应对各类企业客户的任意开发场景。

“在敲开客户大门之前,我们就有故事可讲了,”他说道。

他也直言不讳地说明了自己的研发定位:不是面向开发者的通用工具,而是一个专门针对企业场景的系统,而大多数 AI 编码工具把这些场景条件当作边缘情况:遗留代码库、严格的合规要求、混合环境,以及 AI 生成的看似可以投产但实际上却不行的代码所带来的真实成本。

没人谈及的成本问题

与 Sundaresan 的对话中,有一段十分坦诚的表述,他道出了大多数开发者在不受约束的情况下如何使用 AI 编码工具。

“人们会选择最新的 Claude Opus 4.7 这类顶级模型。他们可能只是执行一条简单的提示词,但成本却高达每百万词元 40 美元,”他说。“这就好比开着法拉利去便利店买牛奶,完全没有必要。”

Bob 不会向用户暴露底层模型,它会根据实际任务需求自动调度路由,可选模型包括 Anthropic Claude、Mistral 开源模型、IBM Granite,以及多款专为 Bob 运行环境定制微调的专有模型。

这种智能路由能力正是 Sundaresan 认为的真正能体现架构设计价值的核心。“这并非简单地将各类模型接入系统,”他表示,“而是要把模型能力、产品体验,以及能够支撑优质体验的架构有机结合起来。模型只是整体方案的一部分。”

他介绍了在 IBM 内部用户群体中开展 A/B 实验的做法:测试各类前沿模型变体、监测用户使用模式,识别出高成本模型被滥用于普通模型即可胜任的场景。这种内部部署让这类大规模实验得以落地,其规模是任何早期初创产品都负担不起的。

智能体市场究竟将去往何方

被问及 Sundaresan 对智能体 AI 炒作周期的看法,他给出的会是研究者视角的答案,而不是管理者视角的表态。

“无风不起浪,”他接受《The New Stack》采访时表示,“如果炒作是烟,那背后一定有火。火势或许没有烟那么大,但火苗确实存在。”

他的判断是,基于智能体的开发模式确有实际价值,但并非新生事物。基于服务的开发、基于 API 的开发、基于智能体的开发,这些模式以往早已存在。真正的变化在于,如今的接口是概率性、对话式的,而非传统的确定性、程序化接口。这种转变催生了全新的能力,同时也带来了全新的风险。

“你也可以分散它的注意力,”他谈及智能体系统时说。“你可以问不该问的问题,或者透露不该透露的信息。”他所看到的 91% 失败的 AI 项目归根结底在于规范或者说纪律的缺失。企业以为和前沿模型提供商签个协议就够了,但事实并非如此。“在把它们集成到你的软件产品之前,你需要遵循已有的规范,”Sundaresan 说道。

他关注一个尚未得到足够重视的发展方向:智能体之间相互交互对话,最终会采用人类无法直接读懂的机器原生语言。“倘若这些衍生语言中出现漏洞差错,这类错误很可能会呈爆炸式扩散蔓延,”他说道。“未来还会有诸多变化发生。我们可以因为害怕而什么都不做,也可以勇敢但系统性地向前推进。”

【声明:本文由 InfoQ 翻译,未经许可禁止转载。】

原文链接:https://thenewstack.io/ibm-bob-agentic-coding/