此乃投献于谷歌I/O写作挑战
谷歌于I/O 2026之演说中,屡屡重申一语。自启发性言至行动。
初闻之,似为市井喧哗。然细览其全,乃有 Gemini 3.5 Flash、Managed Agents、Antigravity 2.0、WebMCP 诸般宣告,方觉此实为吾辈今时之状也。其意深远,非一言可蔽,故当深究之,盖其于软件之构,远胜于单模之出也。
标题:双子座3.5闪存胜于去年之专业版
吾辈当自模型始,盖其基准之故实,诚为可感。
双子座3.5闪存之表现,胜双子座3.1专业版于几乎诸般测试——尤以挑战性代理测试如终端测试2.1(76.2%)及MCP阿特拉斯(83.6%)为甚——而运行四倍速也较之同类边陲之模,今可经由 Gemini API、AI Studio 及 Android Studio 而得之。
此有专由:昔者,汝以速易智。Flash速且廉;Pro智而缓。此权衡之失,遂定吾辈构设机关之式——汝以Flash应速效之唤,而将繁思委诸Pro。
3.5 Flash溃此界域。一模型,速若Flash而思类Pro,则改汝所建诸机关之经纬与利弊。
定价为每百万个词输入1.50美元,输出9.00美元,上下文窗口为1M个词。动态思考默认开启。
真实之况:谷歌推出垂直栈
吾以为多数事后报道所轻者:谷歌非仅推出模型,更推出生产流程。
详述其端:
- Gemini 3.5 Flash — 速捷之模,疆域之器,驱动诸层
- Gemini API之管代理 — 一呼即应,孤/Linux之沙盒立现,管代理可思辨,用器,行码,理文,览网,历呼而态存
- 反重力2.0 — 独立桌面之应用,以调遣诸使,并行其属使,预定其背景之务,融通于 AI Studio、Android 及 Firebase 诸平台
- Antigravity CLI + SDK — 命令行与程序之途径,以达诸使之器
- WebMCP — 乃一拟议之开放网络标准,使汝得以将JavaScript函数与HTML表单显为结构化之工具,以供基于浏览器之智能体所用
-
现代网络指南 — 精选专家审验之技能,导引AI编程工具于常见应用场景,其定义简明于Markdown文件,如
AGENTS.md及SKILL.md
此非模型加插件也,乃自模型推演至生产部署之全流程,谷歌独占Chrome、Android、Play,并掌控网络标准之端。此诚竞争态势之迥异也.
管理代理所解之实
吾屡称之管理代理,窃以为当细察之。
曩者,建置有状态之代理流程,必自理执行之境:备算力,理上下文于回合间,接工具,存状态于调用之际。机关系统之繁复,非尽在智识之理,实乃基础设之脉络也。
管代理更易此。一调API即备离云Linux之境。代理具器,可执码,可瀏览,可理文。后续调API则续同会,存状无缺——不复每轮初设。谷歌称之谓多轮代理流程,自能顺行。
凡自辟代理之基,历时而为之,此抽象之术,诚可省旬日之劳.
诚有直言之诫于开发者之验__
吾欲标其事,而官之布告略之.gemini-3-flash-preview自__JHSNS_SEG_b67d7558_39__迁于gemini-3.5-flash,有默然之破例焉:之thinking_level本然者,今为medium,非high也。直以复制粘贴之法移之,则所得不同,而无显见之谬。
尚有知者:若以 GitHub Copilot 运行代理工作流,每 Flash 调用计 14 倍高级请求。为严肃之代理工作,经 Antigravity SDK 或 Vertex AI 直接 API 途径,其费则大减——规模之下,约省 37 倍.
此等细末,于生产构建之际实属紧要,恨其于发布文档未显彰也。
值得关注之巨变
于此,吾以为 I/O 2026 所示,乃宏观之象也。
去岁今岁,吾辈所问者,"此模之智几何?" 此问渐失其用。3.5 之 Flash 胜 3.1 之 Pro 于代理之测试,而运行更速,此半为模之能事,然大半乃为特定之用而优化也。 优化:多步骤,工具繁重,现实世界智能体循环。
开发者需问新题:执行之面为何?
谷歌之答昭然若揭:执行之境乃代理之辔,其欲之若抗地之御风——行于其云,显于其桌端之应用,经其API,布于安卓于其工作室。安卓之AppFunctions,使应用得直示其能于智能之代理。WebMCP亦引此本原于浏览器。
此乃Google之言:次层开发者平台非运行时亦非框架,乃代理执行之境。彼辈竞逐端到端之主导权。
其事之令人振奋抑或忧虑,或视乎汝对平台整合之渴求。然无论何如,此乃数载以来Google所陈平台叙事之最为通贯者。
吾所瞩目者,其后续如何。
吾将注目数事于来日:
Gemini 3.5 Pro既定于研造,期于六月(二〇二六)推出。若其延展3.5之Flash模式——速而明之思辨——是则模型层级之变也。
WebMCP之采行 乃试Google能否使agent-native web成标准而非专有之能。开标准者,唯他浏览器与工链采之方效。
产中管代理 — 吾欲睹真实开发者之报,于迟滞、可靠、成本诸端,方议荐之於生产之务。其抽象之巧,犹可言也;然所问者,乃其後之基构果能副之否耳.
终论
Google I/O 2026,非“观吾模之智”之会也。乃以模之发为名,而饰平台架构之告也。
双子座3.5之闪速之数,诚为不虚且令人赞叹。然其要者,谷歌所运者乃全然之垂直栈于智能体之开发——自迅捷之前沿级模型,至管理执行之境域,复至桌面之工器,终至网络之标准。此乃基建,非独人工智能也。
于开发者而言,其立竿见影之实益昭然:机关之工作,推演既速且廉;若营制有状之机关,则基构之负亦大减。其远图——彼谷歌之机关平台,果为来世之应用成其主导之执行层否——乃大疑,其解,在于是乎所营制者。
此中事,吾所最欲观也。
尔试否 Gemini 3.5 之速闪或管理代理乎?愿闻尔所营于注脚。






















