智能代理所需，非仅查实而已

人工智能始行，则开发者当审其向，察其域，辨其可逆，明其责。

向之审AI，久矣，惟验其答而已。

若AI生成其释，吾可读之。
若其撮要于文，吾可较之原本。
若其误述事实，吾可正之。
若答案未备，可再诘之。

彼类验证，开发者所习焉。

将文译之，近于披览之。

然AI之器，时移世易矣。

彼等非惟解疑问矣。

彼辈始行矣。

彼辈可寄邮件。
彼辈可预定会晤。
之可編文件也。
之可啟命令也。
之可開拉取請求也。
之可觸發工作流也。
之可自一節至次節，無待於每令。

是變其問題也。

蓋因一答可為審也。

一行留跡也。

误答与误行，其别也

误答，常令人烦

或使人惑
或费时
或需更正

然多事，其害可止于言辞

误行则异

已发之电邮，入他人之箱矣

已定之会，已占他人日程之位。

已更易之文，或损他业。

已行之命，或可易境。

已部署之码，今正运行于某处。

是故人工智能之代理，须有别种之验证。

核验事实非足.

及至人工智能始行，则需行验.

人工智能之行，其意何在？

人闻“人工智能代理人”，常想象其有剧变.

然其实变甚为实用.

电子邮件助理非惟草拟回复.
或可发送之。

日历之助，非惟荐时而已。
或可预定此会。

助编非惟献码而已。
可编辑文件，运行测试，开启PR，或部署变更。

助研之职非惟呈搜得之果。
或可搜集资料，较之诸选，撮其要旨，而促其事之进行。

此乃代理人之实用之义也。

立志为的，分步而为之，用器以助，察中节之效，决继行之事。

此甚有益。

然亦意味着，吾等所验者，非复惟终局之答。

吾辈当验其行迹。

旧之验证之问，不足矣。

吾辈验人工智能所生之文，常问：

此言诚乎？
此言确乎？
其源实乎？
其释备乎？
其信息新乎？

此等之问，犹有深意。

然则，当人工智能行事之时，此问不足矣。

行之事，开发者需别具清单。

1. 方向：此行是否合乎其旨？

人工智能所造之函，文法虽善，犹或非其宜。

辞藻或工。
声调或肃。
事实或确。

然或时辰非其宜。
或许情谊需以柔应之。
或许用户未欲遽然相属。
或许此言使言谈偏歧。

考实难察其谬。

所问非惟：

此诚乎？

所问者：

此举向吾心之所欲耶？

于开发者，此亦关乎代码。

人工智能之代理，或“修正”一虫，然更易系统之广部，非所期也。补丁或能过试，然或与意匠不合。

是故首验之问曰：

其向是否正耶？

2. 范围：代理是否守界？

代理解意。

是善矣，然亦生患。

思此诸训

清此文件夹。

请修正此弊。

善此构件。

整饬此文。

每一则皆似简明。

然各有所潜。

“清理此文件夹”或指更名文件。
或可指删除文件。

“修此虫”或可指更易一法。
或可指整饬周遭之码。

“善此构”或可指调适界面之距。
或可指重撰其状之理。

然弊非恒在AI之坏。

时，行其所思之命意也。

是故，必验其域。

使能者行，当问：

何者可触？
何者不可触？
何文件、何工具、何API、何用户，在界外乎？
越界，需得许否？

次验证之问曰：

其行止是否仅应然耶？

3. 可逆性：其反行之难易若何？

非所有之行重同也。

存草稿非若发函。

本地运码非若部署之。

改私人笔记，非改共享之文也。

删试文，非删生产之数据也。

若AI所答有误，可常编辑之。

若AI之行有误，或需撤销世间之变。

是故可逆性，乃至要之验也。

审行人工智能之举措，当问：

此可逆乎？
可有备份？
有预览之步骤乎？
此乃草稿抑或定稿乎？
若代理人误，则如何？

第三验证之问曰：

此行为若需，可逆乎？

责任：孰主其果？

人工智能不除责。

若人工智能发函，必有人纵之。

若人工智能部署代码，必有人许之。

若人工智能误删文件，误订会议，误改设置，其果犹有所属。

此不适，然要也.

自动化易工之变.

不使责失.

故授能于吏，当问：

孰可准此行？
事成谁闻？
孰察其果？
倘有差池，孰任其咎？
审计之迹安在？

第四验证之问曰：

孰有权柄于其果？

简易验证之策

使智能之使行其事，吾欲验四事：

Direction:
Does this action move in the right direction?

Scope:
Does it do only what it should do?

Reversibility:
Can it be undone if needed?

Responsibility:
Who owns the outcome?

此非繁复之构也。

然其易变吾辈之思于AI之器矣。

吾等止问惟此。

此答案是否正确？

且始诘问之

此行当为之乎？

一人工智能编代码之灵

想一AI编程之灵，得此命也：

修仪表盘之弊。

弱验证之程，或仅验：

此应用果成乎？
测试可曾通过？
此界面可好？

彼验法虽善，然犹未备。

行验证者，求之益深。

向导

代理者是否已修复仪表盘之实患，抑或仅解邻近之困？

范围

此更动仅涉仪表盘相关文件，抑或亦改无关共通逻辑？

可逆性

此更动可否审阅而逆否？属支系抑或已部署？

责任

孰审此PR？孰准此部署？若有所破，孰主其果？

此乃检视码之输出与检视智能之行为之别也.

便捷者，使裁断上移也.

人每以为，随智能之具愈便，人之所以裁断者愈轻.

吾以为适得其反.

便捷者，使裁断上移也.

若人工智能经办事渐多，人可无庸亲决纤微之断。

然所余之断，愈显其重：

当立何标？
许其自主几何？
可令从属用何器？
当止于何处？
何事需请命？
何事不可委之？

机智能愈广，则界域愈宜审明。

自动化减人力之劳。

非去决断之能。

开发者当委何事？

非反智能之使。

多务宜委之。

代理人用之有益，

若流程明晰
任务复沓
其果易验
其域有界
谬误易更
系统有录或审之阶

然当慎之，__JHSNS_SEG_af58f4a4_193__若行影响于人
其果难逆
其令多歧
其使可触机密
其务系乎人境或商境
其效生责于器外

可委事于智机

不可委断于全

终思

人工智能之验证初阶，多在应答之辨。

此解可信乎？
此实确乎？
此源真乎？
此要旨诚乎？

此犹关紧要。

然智能之使，更进其问。

今亦当询：

其向之宜乎？
其域之合乎？
其行可逆乎？
其责之明乎？

当AI为答，吾辈核其事实。

当AI为行，吾辈察其后效。

盖答可读也。

行留迹焉。

初载于Dechive——此乃存档之域，用以验人工智能所生之答，俟其可信而后信之.

https://dechive.dev/en/archive/when-ai-acts-beyond-answers

推薦訂閱源

DEV Community

人工智能始行，则开发者当审其向，察其域，辨其可逆，明其责。

误答与误行，其别也

人工智能之行，其意何在？

旧之验证之问，不足矣。

1. 方向：此行是否合乎其旨？

2. 范围：代理是否守界？

3. 可逆性：其反行之难易若何？

责任：孰主其果？

简易验证之策

一人工智能编代码之灵

便捷者，使裁断上移也.

开发者当委何事？

终思