一、引言
适才睹之,智谱新旗舰之模 GLM-5 已正告于世。
其志甚坚,必欲赶节前而新,盖前版 GLM-4.7 尚未二月耳......

GLM-4.x 之誉,中外共仰,咸称编程之魁首。新章既出,众皆翘首,未知其增何。
直言无隐,去周,彼众相邀,吾已预试此模数日矣。
适逢其时,亦去周,域外双雄亦更其新章:Anthropic 公司之 Claude Opus 4.6,OpenAI 公司之 GPT-5.3-Codex。
此三新模,皆主编程之道,吾不禁较之,察其异同,想亦多所趣。
今以实编之务,试此三AI之能,其生成之果如下。
二、GLM-5 之介
官之发布,如是言GLM-5:为开源之模,GLM-5 完对顶尖闭源之模。,于二处特强之。
(1)复杂系统之工
GLM-5 不惟善生前端之页,更善后端之务、系统重构、深度调试,弃"重前审美、轻底逻辑"之模。
其具强自省与纠谬之机,能于编译败或运行报错时,自主析日志、定位根因并迭修,直至系统通顺。
(二)长程之 Agent
此 Agent 可任长程之务,乃多段次、长步骤之繁任也。能自主析需求,自动化连运数时辰,而持上下文之续,守目标之恒。
(三)小结
GLM-5 所能为之务,已越生成前端 UI,而可生成系统级之巨繁项目,若操作系统内核、浏览器内核、V8 引擎之属。
其宣传之语曰:"在大模型入 Agent、大任之世,GLM-5 乃尔所用之开源之择。"
三、测试之法
吾所择之测试之题,乃 HuggingFace 公司之布道师亚历杭德罗·奥(Alejandro AO)试 Opus 4.6 与 GPT 5.3 之题也。

彼拍一物視畫,示此二模之效。
吾将持此同题以试GLM-5,复较其果。
共四题,前后端皆有。吾已将原始提示词与原始脚本,作一仓库,置于GitHub (GitHub)。
四、網頁設計測試
首试,在网页设计与重构之能。
原始页面甚为简陋。

此唯分类信息,叠置一处耳。吾辈使 AI 更新此页,令其美观易用,显成熟可靠之专业风。
前已言,提示词与原始文件俱在。Git(Hub),此不复赘。诸君可自试之,亦可使他模为之。
此乃GLM-5之生成也。





此果可谓美观而专业,诸信息组织井然,兼有动画之效,手机览之(下图)亦无碍,直可上线。

吾已发布此页,诸君可共观之。点此往观之。
此乃 Opus 4.6 所生之果,自视频截图而得。



下为 GPT-5.3 所生之文。



此三者皆可用,然GPT-5.3有瑕疵(页眉非粘性,拖下即失),且于形制亦不及他二者。
故此试中,GLM-5与Opus 4.6更优,孰胜孰劣,视乎人好恶。吾独爱GLM-5之式。
五、3D沙盒之试
次试观AI模型之3D动画生之能。
其要者,生教育之网页3D沙盒,以动画示太阳系天体之运,可调其质、位、速等参数,亦能手动增新天体。
今示GLM-5所生之果。

页右为动画区,初示三小行星绕中恒星行轨道,可拖拽旋之,亦能缩放。

页之左乃操弄之板,甚善。


其上可调动画与天体之数,其下用以增新天体,或删旧者。
较之,Opus 4.6 之生成。


GPT-5.3 之生成。


此三生成,皆足应需,皆可顺行。然,GLM-5 之动画失引力之网线,GPT-5.3 之网线太乱,故动画之效,Opus 4.6 更优。
操弄之板,GLM-5 与 Opus 4.6 皆设计甚善,GPT-5.3 略简。
总体而言,吾以为此轮最佳者 Opus 4.6,其次 GLM-5,末为 Codex 5.3。
六、网页之戏
三试制网页之戏,名曰"愤怒小鸟"。
GLM-5所成,尚可,类原作,可玩,然戏性不足,跃跃之效不彰。



Opus 4.6所还,甚高,戏验近原作。



GPT-5.3所成,令人赧然,小鸟竟不能跃,戏不可玩。


此轮显见,Opus 4.6为优,GLM-5次之。
七、Laravel转为Next.js
末试者,将PHP之语,Laravel之架,Web之用,转为JavaScript之语,Next.js之架。Laravel框架,转为JavaScript语言Next.js框架。
GLM-5 处理之际,未尝有碍,俄而将 PHP 之语易为 JS 之语,且示其结构。

复于转化之后,殷勤自装所依之软件包,备其脚本之编,告之曰:汝但接外部 API,一触即行npm run dev,则可直用。

余从其言,运行甚顺,无报其错,启localhost:3000,即可访其用。

此乃察城市之天者。因无令改其式,故观之与 PHP 原版无别。
右上角之输入,可询城市。

于其结果,择所欲之城市。

入之,即见城市之详,有天气、日出日落之时、空气之质、地图之讯等。

Opus 4.6 与 GPT-5.3 所得亦同,盖因页面、功能无别,故不赘图。
然有言称,GLM-5 与 GPT-5.3 之转换时,约莫五刻;Opus 4.6 似遇困阻,竟耗二十刻有余。
此番相较,三模皆优,然 GLM-5 转换时短,无报错之虞,全程体验甚佳,吾心倾之。
八、结语
经此诸试,GLM-5 编程之能,堪可圈点,足以与海外最新旗舰相颉颃。某些处或犹胜之,虽不及处,多属细枝末节,非质之别。
闻其训练运行,皆用国产"万卡集群"。想若得更多之卡、更多之算力,其表现必更佳,足与世一梯之大模公司正面竞逐。
复有二事,其强甚焉,曰"复杂系统",曰"长程任务",皆有所感。
所成之系统逻辑与后端代码,信实不差,生成之时,运行之时,报错甚少。所缺者,往往功能之阙,后期使 AI 补之足矣,非架构之弊也。复有一己之务,其行二时有余,终亦成之,未尝紊乱。
吾愿引官语以为结。
二〇二六年编程大模型,自"能写代码"进为"能构系统",而 GLM-5 谓开源界之"系统架构师"模型,自重"前端审美"转重"Agentic深度/系统工程能力",乃 Opus 4.6 与 GPT-5.3 之国产开源平替也。
(终)












