一SaaS之创者,嘱吾等评其CTO所返之"自主AI"商贾之议。其策十八使,一策者大言,一行者大言,一评者大言,六月而成,其模之费增五倍。
今之产品乃应答客户于其账单之门户所问之FAQ之聊天机器人。入问者约八十为"如何将发票导出为PDF"之变体。其余二十则转至人手,盖聊天机器人未谙其术也。
吾等告其始创者,于既存之提示增句,并将此能动之计划置诸积压之列。
此乃每周几近必现之谈。诸商贾皆向 B2B SaaS 之创者游说代理。然多数创者实无此需。今述 Sapota 所用之决断之纲.
人工智能代理者实为何物
去其营销之辞,代理者乃三事附于大语言模型:
- 工具:能调用外函数(搜查、查询数据库、运行代码)之能
- 记忆:跨多LLM调用而存之态
- 自主:LLM决次行,非开发者所定
自主性者,使之为智能体也。寻常之RAG流程,取片段而应答,循固定之序。智能体则每步自决,或取更多,或调用工具,或求明晰,或定答案。
此能实为某些事所宜。然其价每询较寻常LLM调用,昂五至十五倍,速减二至十倍,且调试甚艰。必待算术相宜,而后此役得立其位。
单问之试
萨波塔之滤,一问而已:独一精撰之提示,足竟此务乎?
若然,则勿建代理人,用此提示。
若否,则问:固定两步之管(检索而后生成)可成之乎?若然,则建 RAG 之管,毋为 agent。
若犹无应,则问:此举实需乎动态决断何为后续之策,抑或开发者惟惑于步骤当为何?若属后事,则书其程。设计流程之不适,非委诸大语言模型之由也。
若三问之后,答仍曰"是,此需自主",则代理人乃适器也。吾辈验之,此滤可去"吾需代理人"之谈七成。
创始者之聊机器人所实需者
八成复问关于发票导出者,乃提示之弊也。其初提示若此:
汝乃助人解忧之客服,应答客问。
其修也,乃增:
若用户询及发票导出,则应答曰:"点击设置→账单→导出。择PDF格式及欲选日期区间。"复问其需他事否。
此一语解八成之来量。无需代理人,无需供应商。三分钟之功耳。
所余二十者,分为二类。其十二者,关乎客之账户状态,诚需调用用户数据库之工具。其余八者,乃边缘之例,本应转交于人。
架构得当,宜为单提示聊天之器,具一器(查账),若有难,则托人手。两日之功。每询之费,恒不逾五分钱。其能自主之议,初估每询五分钱,且历六月乃成.
何时宜用人手
吾非恶人手。Sapota所荐建人手之务,有三共性:
真正多步之决断,其第 N 步之结果,依第 N-1 步而定。 研究之综合,其后续之搜寻,依首搜所返之结果而定。代码重构,其后续之文件,依已改之变故而定。客户导入之分诊,其路由,依自多系统所拉之数据而定。
LLM 所需协调之工具。 单一工具调用非为智能体,实乃工具调用而已。智能体之复杂,在于大语言模型于三至七工具间抉择,并融汇其果。客户支持者,取自CRM、知识库、计费系统及货运追踪。销售研究者,合LinkedIn、新闻、财务数据及CRM历史。
成本之谓,方堪其繁。 自主架构于大语言模型之成本,每项任务增价自二分至二角,未计研发与运维之费。此价适于研究助理,售技工程师日使十次。然不适宜于应答器,每月需处理五万问,每问价仅五分者。
吾辈所见之式
吾人所见创始人之谬,莫过于视"代理"为精深之阶,而非具特定应用之器。其说辞甚具诱力:自主、智能、自进、自适。然多数B2B SaaS产品之实,询查多复,数据之源有限,用户之期可测。
善书之示,持一器,设诚信之关,其费、其迟、其信,于下八十之"AI之能"用例,胜于使。其上二十之用例,使胜者诚且要,然非百之用例也。
售此代理平台者,无劝告之诚。其说曰:“代理之智乃未来之趋。”亦曰:“购此平台于吾。”此二说皆可真。此特定之品,亦或尚无参与未来之需。
桃子之荐
未决意于代理之筑:
- 运单问之试。诚言自主之需否。
- 量产之率,估每务之费。乘以所期之询率。较今费。
- 审今之示语与器设。多所谓"AI之能缺",非失代理,乃失示语。
- 若答仍曰"需代理人",当以一代理人、一器始。勿建十八代理人系统,如商所拟。单代理人基线,乃衡多代理人架构是否值其烦之据。
小建以测,渐扩。代理人模式,诚实而有用。然亦常非所问之谬答也。
若商贾向尔游说
若尔之众被言人工智能之代理乃次季之蓝图,则签约之前所问者,乃尔生产之问凡几实需自主也。若商贾不能以尔之数据而应此问,则彼所售者,非解也,乃产也。
萨波塔提供一周之期,审计查询之分布。其取尔生产查询之录,依复杂度分类诸查询,并出尺寸之议,何部分需代理,何部分宜以一 prompt 配适之工。其出为预算与架构之文,尔辈可持以示于商贾或董事会。
欲达,请至 人工智能工程之页。 而君之今时AI架构及约略询量。诊谈之语,几每易“有司或无”之问为“自主之需,究在何处”。












