慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

阮一峰的网络日志

科技爱好者周刊(第 396 期):互联网通信的替代方案 科技爱好者周刊(第 396 期):互联网通信的替代方案 - 阮一峰的网络日志 科技爱好者周刊(第 395 期):软件开发的第三种方式 科技爱好者周刊(第 395 期):软件开发的第三种方式 - 阮一峰的网络日志 科技爱好者周刊(第 393 期):脑腐状态 科技爱好者周刊(第 392 期):axios 投毒与好莱坞式骗术 科技爱好者周刊(第 391 期):AI 的贫富分化 科技爱好者周刊(第 390 期):没有语料,大模型就是智障 套壳中国大模型撑起500亿美元估值?扒一扒 Cursor 的"套壳"疑云 科技爱好者周刊(第 389 期):未来如何招聘程序员 科技爱好者周刊(第 388 期):测试是新的护城河 零安装的"云养虾":ArkClaw 使用指南 科技爱好者周刊(第 387 期):你是领先的 科技爱好者周刊(第 386 期):当外卖员接入 AI 字节全家桶 Seed 2.0 + TRAE 玩转 Skill 科技爱好者周刊(第 385 期):马斯克害怕中国车企吗? 科技爱好者周刊(第 384 期):为什么软件股下跌 科技爱好者周刊(第 383 期):你是第几级 AI 编程 Kimi 的一体化,Manus 的分层 科技爱好者周刊(第 382 期):独立软件的黄昏 AI native Workspace 也许是智能体的下一阶段 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么 科技爱好者周刊(第 380 期):为什么人们拥抱"不对称收益" 科技爱好者周刊(第 379 期):《硅谷钢铁侠》摘录 我如何用 AI 处理历史遗留代码:MiniMax M2.1 升级体验 科技爱好者周刊(第 378 期):预测是新的互联网热点 科技爱好者周刊(第 377 期):14万美元的贫困线 科技爱好者周刊(第 376 期):太空数据中心的争议 科技爱好者周刊(第 375 期):一扇门的 Bug 终于有人做了 Subagent,TRAE 国内版 SOLO 模式来了 科技爱好者周刊(第 374 期):6GHz 的问题 VS Code 使用国产大模型 MiniMax M2 教程 科技爱好者周刊(第 373 期):数据模型是新产品的核心 国产大模型接入 Claude Code 教程:以 Doubao-Seed-Code 为例 科技爱好者周刊(第 372 期):软件界面如何设计 大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5 科技爱好者周刊(第 371 期):一个乐观主义者的专访 科技爱好者周刊(第 370 期):正确的代码高亮 错误处理:异常好于状态码 科技爱好者周刊(第 369 期):Tim 与罗永浩的对谈 科技爱好者周刊(第 368 期):不要这样管理软件团队 一天之内,智谱和 Anthropic 都发了最强编程模型 科技爱好者周刊(第 367 期):Nano Banana 的几个妙用 科技爱好者周刊(第 366 期):旧金山疯狂的 AI 广告 科技爱好者周刊(第 365 期):流量变现正在崩塌 科技爱好者周刊(第 364 期):最难还原的魔方 科技爱好者周刊(第 363 期):最好懂的神经网络解释 科技爱好者周刊(第 362 期):GitHub 工程师谈系统设计 科技爱好者周刊(第 361 期):暗网 Tor 安全吗? 科技爱好者周刊(第 360 期):Dan Wang 的新书
智谱旗舰之GLM-5,实测之:较之Opus 4.6与GPT-5.3-Codex。
阮一峰 · 2026-02-12 · via 阮一峰的网络日志

一、引言

适才睹之,智谱新旗舰之模 GLM-5 已正告于世。

其志甚坚,必欲赶节前而新,盖前版 GLM-4.7 尚未二月耳......

GLM-4.x 之誉,中外共仰,咸称编程之魁首。新章既出,众皆翘首,未知其增何。

直言无隐,去周,彼众相邀,吾已预试此模数日矣。

适逢其时,亦去周,域外双雄亦更其新章:Anthropic 公司之 Claude Opus 4.6,OpenAI 公司之 GPT-5.3-Codex。

此三新模,皆主编程之道,吾不禁较之,察其异同,想亦多所趣。

今以实编之务,试此三AI之能,其生成之果如下。

二、GLM-5 之介

官之发布,如是言GLM-5:为开源之模,GLM-5 完对顶尖闭源之模。,于二处特强之。

(1)复杂系统之工

GLM-5 不惟善生前端之页,更善后端之务、系统重构、深度调试,弃"重前审美、轻底逻辑"之模。

其具强自省与纠谬之机,能于编译败或运行报错时,自主析日志、定位根因并迭修,直至系统通顺。

(二)长程之 Agent

此 Agent 可任长程之务,乃多段次、长步骤之繁任也。能自主析需求,自动化连运数时辰,而持上下文之续,守目标之恒。

(三)小结

GLM-5 所能为之务,已越生成前端 UI,而可生成系统级之巨繁项目,若操作系统内核、浏览器内核、V8 引擎之属。

其宣传之语曰:"在大模型入 Agent、大任之世,GLM-5 乃尔所用之开源之择。"

三、测试之法

吾所择之测试之题,乃 HuggingFace 公司之布道师亚历杭德罗·奥(Alejandro AO)试 Opus 4.6 与 GPT 5.3 之题也。

彼拍一物視畫,示此二模之效。

吾将持此同题以试GLM-5,复较其果。

共四题,前后端皆有。吾已将原始提示词与原始脚本,作一仓库,置于GitHub (GitHub)

四、網頁設計測試

首试,在网页设计与重构之能。

原始页面甚为简陋。

此唯分类信息,叠置一处耳。吾辈使 AI 更新此页,令其美观易用,显成熟可靠之专业风。

前已言,提示词与原始文件俱在。Git(Hub),此不复赘。诸君可自试之,亦可使他模为之。

此乃GLM-5之生成也。

此果可谓美观而专业,诸信息组织井然,兼有动画之效,手机览之(下图)亦无碍,直可上线。

吾已发布此页,诸君可共观之。点此往观之。

此乃 Opus 4.6 所生之果,自视频截图而得。

下为 GPT-5.3 所生之文。

此三者皆可用,然GPT-5.3有瑕疵(页眉非粘性,拖下即失),且于形制亦不及他二者。

故此试中,GLM-5与Opus 4.6更优,孰胜孰劣,视乎人好恶。吾独爱GLM-5之式。

五、3D沙盒之试

次试观AI模型之3D动画生之能。

其要者,生教育之网页3D沙盒,以动画示太阳系天体之运,可调其质、位、速等参数,亦能手动增新天体。

今示GLM-5所生之果。

页右为动画区,初示三小行星绕中恒星行轨道,可拖拽旋之,亦能缩放。

页之左乃操弄之板,甚善。

其上可调动画与天体之数,其下用以增新天体,或删旧者。

较之,Opus 4.6 之生成。

GPT-5.3 之生成。

此三生成,皆足应需,皆可顺行。然,GLM-5 之动画失引力之网线,GPT-5.3 之网线太乱,故动画之效,Opus 4.6 更优。

操弄之板,GLM-5 与 Opus 4.6 皆设计甚善,GPT-5.3 略简。

总体而言,吾以为此轮最佳者 Opus 4.6,其次 GLM-5,末为 Codex 5.3。

六、网页之戏

三试制网页之戏,名曰"愤怒小鸟"。

GLM-5所成,尚可,类原作,可玩,然戏性不足,跃跃之效不彰。

Opus 4.6所还,甚高,戏验近原作。

GPT-5.3所成,令人赧然,小鸟竟不能跃,戏不可玩。

此轮显见,Opus 4.6为优,GLM-5次之。

七、Laravel转为Next.js

末试者,将PHP之语,Laravel之架,Web之用,转为JavaScript之语,Next.js之架。Laravel框架,转为JavaScript语言Next.js框架。

GLM-5 处理之际,未尝有碍,俄而将 PHP 之语易为 JS 之语,且示其结构。

复于转化之后,殷勤自装所依之软件包,备其脚本之编,告之曰:汝但接外部 API,一触即行npm run dev,则可直用。

余从其言,运行甚顺,无报其错,启localhost:3000,即可访其用。

此乃察城市之天者。因无令改其式,故观之与 PHP 原版无别。

右上角之输入,可询城市。

于其结果,择所欲之城市。

入之,即见城市之详,有天气、日出日落之时、空气之质、地图之讯等。

Opus 4.6 与 GPT-5.3 所得亦同,盖因页面、功能无别,故不赘图。

然有言称,GLM-5 与 GPT-5.3 之转换时,约莫五刻;Opus 4.6 似遇困阻,竟耗二十刻有余。

此番相较,三模皆优,然 GLM-5 转换时短,无报错之虞,全程体验甚佳,吾心倾之。

八、结语

经此诸试,GLM-5 编程之能,堪可圈点,足以与海外最新旗舰相颉颃。某些处或犹胜之,虽不及处,多属细枝末节,非质之别。

闻其训练运行,皆用国产"万卡集群"。想若得更多之卡、更多之算力,其表现必更佳,足与世一梯之大模公司正面竞逐。

复有二事,其强甚焉,曰"复杂系统",曰"长程任务",皆有所感。

所成之系统逻辑与后端代码,信实不差,生成之时,运行之时,报错甚少。所缺者,往往功能之阙,后期使 AI 补之足矣,非架构之弊也。复有一己之务,其行二时有余,终亦成之,未尝紊乱。

吾愿引官语以为结。

二〇二六年编程大模型,自"能写代码"进为"能构系统",而 GLM-5 谓开源界之"系统架构师"模型,自重"前端审美"转重"Agentic深度/系统工程能力",乃 Opus 4.6 与 GPT-5.3 之国产开源平替也。

(终)