慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
智能代理所需,非仅查实而已
Dechive · 2026-05-24 · via DEV Community

人工智能始行,则开发者当审其向,察其域,辨其可逆,明其责。

向之审AI,久矣,惟验其答而已。

若AI生成其释,吾可读之。
若其撮要于文,吾可较之原本。
若其误述事实,吾可正之。
若答案未备,可再诘之。

彼类验证,开发者所习焉。

将文译之,近于披览之。

然AI之器,时移世易矣。

彼等非惟解疑问矣。

彼辈始行矣。

彼辈可寄邮件。
彼辈可预定会晤。
之可編文件也。
之可啟命令也。
之可開拉取請求也。
之可觸發工作流也。
之可自一節至次節,無待於每令。

是變其問題也。

蓋因一答可為審也。

一行留跡也。

误答与误行,其别也

误答,常令人烦

或使人惑
或费时
或需更正

然多事,其害可止于言辞

误行则异

已发之电邮,入他人之箱矣

已定之会,已占他人日程之位。

已更易之文,或损他业。

已行之命,或可易境。

已部署之码,今正运行于某处。

是故人工智能之代理,须有别种之验证。

核验事实非足.

及至人工智能始行,则需行验.

人工智能之行,其意何在?

人闻“人工智能代理人”,常想象其有剧变.

然其实变甚为实用.

电子邮件助理非惟草拟回复.
或可发送之。

日历之助,非惟荐时而已。
或可预定此会。

助编非惟献码而已。
可编辑文件,运行测试,开启PR,或部署变更。

助研之职非惟呈搜得之果。
或可搜集资料,较之诸选,撮其要旨,而促其事之进行。

此乃代理人之实用之义也。

立志为的,分步而为之,用器以助,察中节之效,决继行之事。

此甚有益。

然亦意味着,吾等所验者,非复惟终局之答。

吾辈当验其行迹。

旧之验证之问,不足矣。

吾辈验人工智能所生之文,常问:

  • 此言诚乎?
  • 此言确乎?
  • 其源实乎?
  • 其释备乎?
  • 其信息新乎?

此等之问,犹有深意。

然则,当人工智能行事之时,此问不足矣。

行之事,开发者需别具清单。

1. 方向:此行是否合乎其旨?

人工智能所造之函,文法虽善,犹或非其宜。

辞藻或工。
声调或肃。
事实或确。

然或时辰非其宜。
或许情谊需以柔应之。
或许用户未欲遽然相属。
或许此言使言谈偏歧。

考实难察其谬。

所问非惟:

此诚乎?

所问者:

此举向吾心之所欲耶?

于开发者,此亦关乎代码。

人工智能之代理,或“修正”一虫,然更易系统之广部,非所期也。补丁或能过试,然或与意匠不合。

是故首验之问曰:

其向是否正耶?

2. 范围:代理是否守界?

代理解意。

是善矣,然亦生患。

思此诸训

清此文件夹。

请修正此弊。

善此构件。

整饬此文。

每一则皆似简明。

然各有所潜。

“清理此文件夹”或指更名文件。
或可指删除文件。

“修此虫”或可指更易一法。
或可指整饬周遭之码。

“善此构”或可指调适界面之距。
或可指重撰其状之理。

然弊非恒在AI之坏。

时,行其所思之命意也。

是故,必验其域。

使能者行,当问:

  • 何者可触?
  • 何者不可触?
  • 何文件、何工具、何API、何用户,在界外乎?
  • 越界,需得许否?

次验证之问曰:

其行止是否仅应然耶?

3. 可逆性:其反行之难易若何?

非所有之行重同也。

存草稿非若发函。

本地运码非若部署之。

改私人笔记,非改共享之文也。

删试文,非删生产之数据也。

若AI所答有误,可常编辑之。

若AI之行有误,或需撤销世间之变。

是故可逆性,乃至要之验也。

审行人工智能之举措,当问:

  • 此可逆乎?
  • 可有备份?
  • 有预览之步骤乎?
  • 此乃草稿抑或定稿乎?
  • 若代理人误,则如何?

第三验证之问曰:

此行为若需,可逆乎?

责任:孰主其果?

人工智能不除责。

若人工智能发函,必有人纵之。

若人工智能部署代码,必有人许之。

若人工智能误删文件,误订会议,误改设置,其果犹有所属。

此不适,然要也.

自动化易工之变.

不使责失.

故授能于吏,当问:

  • 孰可准此行?
  • 事成谁闻?
  • 孰察其果?
  • 倘有差池,孰任其咎?
  • 审计之迹安在?

第四验证之问曰:

孰有权柄于其果?

简易验证之策

使智能之使行其事,吾欲验四事:

Direction:
Does this action move in the right direction?

Scope:
Does it do only what it should do?

Reversibility:
Can it be undone if needed?

Responsibility:
Who owns the outcome?

全屏入 全屏出

此非繁复之构也。

然其易变吾辈之思于AI之器矣。

吾等止问惟此。

此答案是否正确?

且始诘问之

此行当为之乎?

一人工智能编代码之灵

想一AI编程之灵,得此命也:

修仪表盘之弊。

弱验证之程,或仅验:

  • 此应用果成乎?
  • 测试可曾通过?
  • 此界面可好?

彼验法虽善,然犹未备。

行验证者,求之益深。

向导

代理者是否已修复仪表盘之实患,抑或仅解邻近之困?

范围

此更动仅涉仪表盘相关文件,抑或亦改无关共通逻辑?

可逆性

此更动可否审阅而逆否?属支系抑或已部署?

责任

孰审此PR?孰准此部署?若有所破,孰主其果?

此乃检视码之输出与检视智能之行为之别也.

便捷者,使裁断上移也.

人每以为,随智能之具愈便,人之所以裁断者愈轻.

吾以为适得其反.

便捷者,使裁断上移也.

若人工智能经办事渐多,人可无庸亲决纤微之断。

然所余之断,愈显其重:

  • 当立何标?
  • 许其自主几何?
  • 可令从属用何器?
  • 当止于何处?
  • 何事需请命?
  • 何事不可委之?

机智能愈广,则界域愈宜审明。

自动化减人力之劳。

非去决断之能。

开发者当委何事?

非反智能之使。

多务宜委之。

代理人用之有益,

  • 若流程明晰
  • 任务复沓
  • 其果易验
  • 其域有界
  • 谬误易更
  • 系统有录或审之阶

  • 然当慎之,__JHSNS_SEG_af58f4a4_193__若行影响于人
  • 其果难逆
  • 其令多歧
  • 其使可触机密
  • 其务系乎人境或商境
  • 其效生责于器外

可委事于智机

不可委断于全

终思

人工智能之验证初阶,多在应答之辨。

此解可信乎?
此实确乎?
此源真乎?
此要旨诚乎?

此犹关紧要。

然智能之使,更进其问。

今亦当询:

  • 其向之宜乎?
  • 其域之合乎?
  • 其行可逆乎?
  • 其责之明乎?

当AI为答,吾辈核其事实。

当AI为行,吾辈察其后效。

盖答可读也。

行留迹焉。


初载于Dechive——此乃存档之域,用以验人工智能所生之答,俟其可信而后信之.

https://dechive.dev/en/archive/when-ai-acts-beyond-answers