惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
T
ThreatConnect
SecWiki News
SecWiki News
F
Future of Privacy Forum
AWS News Blog
AWS News Blog
C
Cisco Blogs
A
Arctic Wolf
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Scott Helme
Scott Helme
V
V2EX
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
G
Google Developers Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
N
News | PayPal Newsroom
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
Microsoft Azure Blog
Microsoft Azure Blog
量子位
The Hacker News
The Hacker News
Stack Overflow Blog
Stack Overflow Blog
Security Latest
Security Latest
M
Microsoft Research Blog - Microsoft Research
Google Online Security Blog
Google Online Security Blog
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
I
InfoQ
Google DeepMind News
Google DeepMind News
Y
Y Combinator Blog
The Cloudflare Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
Cisco Talos Blog
Cisco Talos Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Troy Hunt's Blog
F
Fox-IT International blog
S
Security @ Cisco Blogs
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Comments on: Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
GbyAI
GbyAI
Project Zero
Project Zero
腾讯CDC
T
Tailwind CSS Blog

人人都是产品经理

AI 产品经理手记:一份能跟模型团队 battle 的评测框架(上) – 人人都是产品经理 酒店配送机器人・软性动态场景全流程思辨复盘 工业数字化与行业软件产品,如何从客户愿意购买的商品,变成公司能持续经营的业务? 小红书郑州帮打法进化成什么样了? – 人人都是产品经理, 第一个游戏项目,别急着把 AI 塞进工作流 – 人人都是产品经理, AI时代,产品经理如何设计更懂用户的大屏可视化产品 – 人人都是产品经理, 寻找Token之上的硬资产:2026年AI应用层的去泡沫与范式转移 – 人人都是产品经理, 会计引擎原理及流程 从传统 PM 到AI PM,我们如何用一套框架复盘自己的项目(四步法),让面试官能认可和点头 – 人人都是产品经理, HarmonyOS 6.0/6.1 核心新特性:空间、智能、全场景全面革新 – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-2-岗位已经模糊 – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-2-岗位已经模糊 – 人人都是产品经理, 从0到量产:汽车IPD全流程落地实战案例(内含阶段详解) – 人人都是产品经理, AI评测如何避坑?从信息聚合到独立标准的产品逻辑 – 人人都是产品经理, AI互联网日报:DeepSeek调用量登顶/小米新机或新增AI键/Google伙伴Xreal继续押注智能眼镜 – 人人都是产品经理, 小红书博主管理与深度链接 – 人人都是产品经理, 企业经营分析・财务指标全景地图 – 人人都是产品经理, AI用户体验要素三:“Agent to UI”设计组件新范式 – 人人都是产品经理, DTC 衰落,网红品牌大衰退 – 人人都是产品经理, AI生产力:从效率到工作流重构 – 人人都是产品经理, LinkedIn废掉APM那天,我撕掉了团队的产品经理招聘JD – 人人都是产品经理, AI 正在从功能插件变成行动单元,AI PM你准备好重建“系统感”了吗? – 人人都是产品经理, 你认为很low的蜜雪冰城,才是做品牌的风向标。 – 人人都是产品经理, 没有人推拉勾一下,它只是自己倒下了 – 人人都是产品经理, OpenAI急着上市,但ChatGPT不是它的王牌,Codex才是 – 人人都是产品经理, 产品经理如何进行需求优先级排序? – 人人都是产品经理, Gemini 3.5:谷歌的 Agentic 时代宣言,我们该怎么接? – 人人都是产品经理, AI 抢走了”有”,抢不走”无” – 人人都是产品经理, 系统 Prompt 写了 3000 字,用户只问了你好 – 人人都是产品经理, 「传统企业数字化升级」系列第三篇——传统服务型企业如何互联网升级 – 人人都是产品经理 HappyOyster、Genie 3、混元 HY-World 的产品逻辑与战略博弈 – 人人都是产品经理, 【运营思考】人与人之间最大的区别,就是思想的不同 – 人人都是产品经理, 不会写代码的我,是怎么一个人跑通五个产品的 – 人人都是产品经理, Prompt 工程在 Agent 里怎么跑 – 人人都是产品经理 从0开始vibe coding,产品上线一个月1500+用户,我的一些思考 – 人人都是产品经理, 为了给我的AI团队造间”办公室”,我开发了这套本地多Agent协作系统 – 人人都是产品经理, 中小品牌开拓新渠道的正确姿势! – 人人都是产品经理, 半年前我就在做Harness Engineering – 人人都是产品经理, 拉勾破产:一段互联网创业简史 – 人人都是产品经理, 从一次面试的“卡壳”,看全球化浪潮下tob市场人的能力重构 – 人人都是产品经理, AI执行规范只有70%?剩下的30%靠系统“护栏”兜底,一个AI产品经理的可靠性设计笔记 – 人人都是产品经理, 中企赴波兰展业:财税数字化蓝图 – 人人都是产品经理, AI互联网日报:Anthropic盈利和OpenAI上市,AI行业要变天了/今日头条对头条百科业务进行裁员调整 – 人人都是产品经理, 2026重塑产品-周期篇:它是静止的还是动态的? – 人人都是产品经理, 当90%的工程师用AI写代码,AI 组织的管理者要怎么办? – 人人都是产品经理, 货代单证模板实战:如何把「排版权」还给业务,又不丢掉数据准确性? – 人人都是产品经理, AI 时代,构建本地AI知识库 – 人人都是产品经理, 面试、述职、汇报时,总有人问:“你的分析结论,怎么落地闭环?”三种模式,轻松回答! – 人人都是产品经理, 一张图讲透:预算治理架构 – 人人都是产品经理, 我们是行业里最早拥抱AIGC的一批,三年后却越来越差 – 人人都是产品经理, AI 应用搭建平台的知识库竞品分析:RAG 功能为什么会这样设计? ——以百度千帆与 Lyzr AI 为例 – 人人都是产品经理, 中国Agent产业面临的四重不确定性挑战——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读六 – 人人都是产品经理, 单枪匹马年入百万美金:拆透海外顶流创客 Dan Koe 的产品逻辑与超级个体法则 – 人人都是产品经理, 产品经理的AI护城河:不是写Prompt,是接住那颗从未变过的人 – 人人都是产品经理, AI时代,产品经理的AI落地指南! – 人人都是产品经理, AI互联网日报:Spotify把AI翻唱推向版权灰区/Google AI眼镜接近可用/京东或20亿英镑竞购英国电商 – 人人都是产品经理, 一文看懂VLA:自动驾驶的下一个范式 – 人人都是产品经理, 终于,微信公众号也不让你留个人微信号了 – 人人都是产品经理, 中国Agent产业发展趋势——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读五 – 人人都是产品经理, AI还原页面设计怎么做?我实测后总结了这套「块状精修法」! – 人人都是产品经理, AI用户体验要素二:那些无法忽略的UI交互行为 – 人人都是产品经理, 货代员工管理实战:如何把考勤、加班和人力成本做成可控的经营数据? – 人人都是产品经理, 月薪5万也招不到?AI产品经理的真实薪资与隐形门槛 – 人人都是产品经理, 大多数AI产品,其实是在给自己人做的 – 人人都是产品经理, 运营人必懂的3步数据分析逻辑,一线业务应用指南 – 人人都是产品经理, 我的AI写稿全流程公开 – 人人都是产品经理, 从 Gemini 实时多模态狂欢降温:B 端产品经理该怎么看这场 Omni 进化 – 人人都是产品经理, AI搜索没有杀死广告。它只是把广告藏进了你信任的那句话里 – 人人都是产品经理, 跨境税务系统:边界、能力与风险前置06 如何创建一家AI Native公司?Anthropic刚发的这份手册,把答案说清楚了 – 人人都是产品经理, 跨境账务系统:在不确定中形成可解释结果05 – 人人都是产品经理, Electron-OH 37.2.1 正式发布:鸿蒙PC开发体验全面升级,跨端开发再提速 – 人人都是产品经理, Notion CEO重新定义了一件事:什么样的人在AI时代真正值钱 – 人人都是产品经理, Notion CEO重新定义了一件事:什么样的人在AI时代真正值钱 – 人人都是产品经理, AI搜索的广告比你想象中更危险:它连你的怀疑都省了 – 人人都是产品经理, 做了一年客服型外呼 Agent,我发现旧的效果评估体系正在失效 – 人人都是产品经理 我以为用户好评是成功,直到我发现它背后藏着一个致命的陷阱… – 人人都是产品经理, 谷歌 I/O 炸场看完了:别再用百万级的自嗨对话框去增加企业的翻译税 – 人人都是产品经理, AI写代码的速率是人的10倍,端到端却只快了2倍:产品经理视角下,没人讲清楚的3件事 – 人人都是产品经理, 提示词的本质:不是“咒语”,而是 AI 产品设计中的需求表达能力 – 人人都是产品经理, 和代运营合作5年后,我真的不建议大健康私域再找代运营了! – 人人都是产品经理, 场景不同,测评方法需要因地制宜:最新摸索的测评“四象限法则”分享 – 人人都是产品经理, 为什么很多人抄爆款,越抄越不像? – 人人都是产品经理, 妙鸭AI生图团队解散:从”时代宠儿”到”被遗忘者”的启示 – 人人都是产品经理 构建数字孪生生态:从封闭系统到开放平台 – 人人都是产品经理, 一文讲透医疗 AI 的隐私合规:技术、场景、落地、避坑 90%的模型微调是浪费钱的——我说“不调” – 人人都是产品经理, 企业可以这样落地 AI 能力(二):技能蒸馏 – 人人都是产品经理 鸿蒙 HarmonyOS 6.1.1 (API 24) Beta1 发布:开发能力全面升级,构建更高效智能生态 – 人人都是产品经理, Claude 三件套:从想清楚,到看得见,到做出来。它要把”想法变产品”全包了 Claude 三件套:从想清楚,到看得见,到做出来。它要把”想法变产品”全包了 – 人人都是产品经理 为什么餐厅都在劝你去买团购券? – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-1 – 人人都是产品经理, 最近几个月的AI大模型独立应用实践-1 – 人人都是产品经理, 别让模型拖后腿:我用6年产品经验总结的AI选型法则 – 人人都是产品经理, 我做了一个对比实验:为什么同一个模型,两个 AI 工具产出差距如此巨大 – 人人都是产品经理, AI用户体验要素一:从“操作工具”到“委托代理人” – 人人都是产品经理, 不是教你用 AI 写 PPT,是把 AI 训练成”你自己” – 人人都是产品经理 Google I/O 2026 XR篇:最轻的眼镜没有界面 – 人人都是产品经理, 深聊100家教育企业后,我总结了7种链路拆解线索获客链路 – 人人都是产品经理,
大模型交互的底层原理:给模型造一个临时执行环境 – 人人都是产品经理,
秋孝隱 · 2026-05-26 · via 人人都是产品经理

大模型的交互逻辑远比简单的"提问-回答"复杂得多。提示词实质上是在为模型构建一个临时任务环境,通过背景信息、规则约束和示例引导,让AI真正理解你的需求。本文将从10个层面深度解析提示词如何塑造大模型的行为逻辑,带你掌握从基础提问到复杂Agent设计的核心技术原理。

很多人刚开始用大模型时,会把提示词理解成”问 AI 的那句话”。但如果想真正理解大模型交互的底层原理,就要换个角度看:提示词其实是在模型回答之前,临时搭出来的一套任务执行环境。你给它什么背景、什么材料、什么规则,它就会沿着这些信息去理解任务、生成结果

在这个环境里,模型会看到任务说明、背景信息、输入材料、示例、输出格式、限制条件、历史对话、检索资料、工具返回结果等内容。它会根据这些信息判断:现在要做什么,按照什么标准做,最后应该输出成什么样

这也是大模型和普通搜索之间最明显的区别。搜索引擎通常根据关键词去找已有网页;大语言模型则是在当前上下文里生成接下来最合适的内容。它不会天然知道你的真实意图,也不会自动理解某个业务场景里的隐藏规则。你不给背景,它只能猜;你不给格式,它会自由发挥;你不给判断标准,它就可能按最常见的方式回答

比如“帮我安排一次旅行”这个指令就太宽了。模型不知道你想去哪、去几天、预算多少、喜欢轻松还是紧凑、有没有老人小孩同行,只能按常见旅行攻略来猜

但如果你写成:

“请帮我安排一趟 3 天 2 晚的杭州旅行。我从上海出发,预算控制在 2000 元以内,想以西湖、博物馆和本地美食为主,不想行程太赶。请按每天上午、下午、晚上安排,并说明交通方式。”

模型拿到的信息就完整得多。它知道目的地、出发地、时间、预算、偏好、节奏和输出格式,生成结果自然会更贴近你的真实需求

这件事看起来只是“提示词写得更详细了”,但往深处看,其实牵出了大模型交互的整套逻辑:模型为什么会受上下文影响?为什么几个示例就能改变输出?为什么 RAG 要把资料塞进上下文?为什么 Agent 要记录状态、调用工具?为什么 Token 会限制一次交互的效果?

今天我们就顺着这条线,一层一层拆开说

✎ 第一层:大模型是在上下文里生成内容

大语言模型的工作方式,可以粗略理解为:根据已经看到的文本和信息,预测接下来最合适的内容。这里的“已经看到的文本和信息”,就是上下文

上下文里放了什么,模型就会受到什么影响;上下文组织得清不清楚,也会影响模型理解任务的稳定性

比如你输入:

“苹果很好。”

模型可能不知道你说的是水果、公司、品牌、口感,还是投资标的。因为这句话本身缺少上下文

但如果你输入:

“请作为营养师,判断下面这句话中的’苹果’指什么,并解释它的健康价值:苹果很好。”

模型更可能把“苹果”理解为水果

如果你输入:

“请作为科技行业分析师,判断下面这句话中的’苹果’指什么,并分析它在消费电子行业的竞争优势:苹果很好。”

模型又会切换到另一个方向

这说明模型理解一个词时,会结合周围信息判断意义。提示词真正做的事情,就是通过角色、任务、背景、材料和约束,把模型的生成方向收窄

所以,“会提问”其实是上下文设计能力。一个好的提示词,重点不是把话写得多漂亮,而是让模型少猜一点,让任务边界清楚一点

✎ 第二层:提示词把一部分任务适配搬到了推理阶段

在传统机器学习或早期自然语言处理任务中,如果想让模型完成一个特定任务,通常要准备数据、设计标签、训练模型,或者在预训练模型基础上继续微调

比如你要做情感分类,就要准备大量带有“正面、负面、中性”标签的数据,让模型通过训练学会这个任务

这就是“预训练—微调”范式。它的逻辑是:先让模型在海量数据上学习通用语言能力,再针对某个任务继续训练,让模型参数发生变化,从而适应这个任务

大语言模型出现后,很多任务可以换一种做法。你可以直接把任务写进提示词里,让模型在当前输入中理解任务。例如:

“请判断以下评论的情感倾向,只输出正面、负面或中性。”

这时候,你没有重新训练模型,也没有改变模型参数。你只是把任务目标、输入文本和输出标签放进了上下文。模型通过提示词理解当前要做的是分类任务,然后生成对应结果

这就是“预训练—提示”范式。它带来的变化是:任务适配可以发生在推理阶段

这一点很重要。提示词工程之所以有价值,正是因为它让普通用户和开发者可以通过输入设计调用模型已有能力。分类、总结、翻译、抽取、改写、代码生成、方案规划、表格整理,很多任务都可以通过提示词重新表达成语言模型可执行的任务

所以,提示词不是模型外面的一层装饰。它是一种任务适配方式。原来需要训练数据、模型结构和参数更新来表达的任务,现在有一部分可以转化成自然语言说明、示例和输出约束

✎ 第三层:任务重表述决定模型能不能理解你

提示词范式里有一个很重要的概念:任务重表述

所谓任务重表述,就是把一个任务重新表达成模型能理解、能执行的语言输入。它要把任务目标、判断标准、输入边界和输出形式讲清楚

比如,“分析这段话”就是一个很弱的任务表述。模型不知道你要分析什么:观点、结构、情绪、逻辑漏洞、关键词,还是商业价值?

更好的写法是:

“请分析下面这段文字的核心观点、论证逻辑和潜在问题。输出分为三部分:核心观点、论证链路、可改进之处。不要扩展原文之外的信息。”

这个提示词做了几件事:定义任务,限定分析角度,规定输出结构,也约束模型少自由发挥

再比如,传统信息抽取任务可能需要专门模型来识别人名、公司、地点、日期和金额。但在提示词范式下,你可以写成:

“请从以下文本中提取人物、组织、地点、时间和金额,并按 JSON 格式输出。如果某项不存在,填 null。”

这时候,模型执行的是一个被语言化、结构化的抽取任务

所以,提示词底层考验的不是“问法技巧”,而是任务建模能力。你越能把模糊需求改写成清晰任务,模型越容易稳定输出

✎ 第四层:示例能让模型临时理解任务模式

很多人用大模型时都会发现一个现象:有时候写一大段规则,不如给几个例子好用

这背后是上下文学习,也就是 In-Context Learning。它指的是:模型不更新参数,只通过当前上下文里的说明和示例,临时推断任务模式,然后处理新的输入

例如,你想让模型把用户评论分成“夸赞、抱怨、咨询、建议”四类。如果只写规则,模型可能仍然判断不稳定。但如果你给它几个示例:

`“物流很快,包装也不错。” → 夸赞

“等了五天还没发货。” → 抱怨

“这个有黑色款吗?” → 咨询

“建议增加大包装。” → 建议`

然后再给它一条新评论:

“希望以后能出无糖版本。”

模型就更容易判断为“建议”

这里发生的事情,并不是模型被重新训练了。它只是从当前上下文里看到了任务模式。示例告诉模型:标签有哪些,判断标准是什么,输出格式是什么,边界情况怎么处理。模型根据这些示例临时归纳规律,再处理新的输入

这就是少样本提示的底层逻辑。它让模型通过上下文中的样例获得任务模式

这也解释了为什么示例质量很重要。示例前后不一致,模型会学到混乱规则;示例覆盖太窄,模型遇到边界情况就容易误判;示例顺序或标签分布有偏,也可能影响输出。所以 few-shot 不是随便贴几个例子,而是在上下文窗口里放入最能代表任务标准的样本

✎ 第五层:提示也可以变成可学习参数

普通用户接触最多的是人工编写的提示词,也就是自然语言提示。比如“请总结以下内容”“请用表格输出”“请扮演一名产品经理”。这种提示词人能读懂,也能直接修改

但在更深入的模型适配中,提示不一定总是自然语言。还有一类叫可学习提示,常见形式包括 Prompt Tuning、Prefix Tuning、P-Tuning 等。它们不是让人手写一句提示,而是训练一小部分提示相关参数,让模型更适合某个任务

可以把任务适配方式理解成一个连续谱:

  1. 不更新参数:人工提示、零样本提示、少样本提示、RAG
  2. 少量参数更新:Prompt Tuning、Prefix Tuning、P-Tuning、Adapter、LoRA 等
  3. 大量或全量参数更新:传统微调、全量微调

这个谱系说明了一件事:提示词工程处在模型任务适配的大体系里。最轻量的方式是直接写提示词;任务需要外部知识时,可以加入 RAG;任务需要更稳定地适配特定场景时,可以训练少量参数;要求极高时,才可能进入全量微调

这也能纠正一个常见误解:提示词不是低级玩法,微调也不是永远更高级。它们只是成本、灵活性、稳定性和维护方式不同。提示词适合快速试错和灵活任务,RAG 适合引入外部知识,参数高效方法适合更稳定的任务适配,全量微调适合高投入、高确定性的专门场景

✎ 第六层:模型越强,越容易表现出零样本和少样本能力

提示词为什么在大模型时代突然变得重要?一个原因是模型规模、训练数据和指令跟随能力提升后,模型有了更强的跨任务泛化能力

简单说,小模型往往更依赖专门训练。你让它做一个新任务,它可能不知道任务模式。大模型在预训练中见过大量语言形式、任务描述、问答模式和推理样例,所以更可能根据提示词理解新任务

这也是零样本和少样本能力成为大模型重要特征的原因

零样本提示是不给示例,只给任务说明。例如:

“请把下面这段话总结成三点。”

少样本提示是给几个输入输出样例,让模型学习格式和标准。例如:

“输入:…… 输出:……”

“输入:…… 输出:……”

“现在请处理新的输入:……”

模型越强,越可能在没有专门训练的情况下理解任务;模型越弱,越需要更多示例、更明确的约束,甚至需要微调

所以,提示词效果不只取决于你写得好不好,也取决于模型本身有没有相应能力。提示词不能凭空创造模型没有的能力,它只能调动、组织和约束模型已有能力

✎ 第七层:上下文工程是提示工程的升级

早期大家谈提示工程,重点是”怎么写一句好提示”。但现在的大模型应用越来越复杂,模型一次生成前看到的内容,可能包括系统规则、历史对话、检索片段、工具说明、文件内容、图片信息、用户偏好和任务状态

这时候,决定输出质量的就不再是某一句提示,而是整个上下文环境

所以,提示工程正在扩展为上下文工程。上下文工程关心的问题包括:哪些信息应该进入上下文,哪些应该丢弃,哪些需要摘要,哪些需要检索,哪些需要长期保存,工具结果怎样压缩,历史对话保留多少,输出空间预留多少

可以把上下文窗口想象成一个有限的桌面。你要让模型完成任务,就要把最有价值的材料放到桌面上。桌面越乱,模型越容易抓错重点;材料越相关、结构越清楚,模型越容易完成任务

上下文工程的原则很朴素:追求高信号、低噪声,而不是一味追求更长的上下文

比如,让模型根据一份 100 页文档回答问题,最粗糙的做法是把整份文档塞进去。更好的做法是先检索最相关的段落,再把这些段落连同问题一起交给模型。这样既节省 Token,也减少噪声,还能提高回答准确性

✎ 第八层:RAG 是把外部知识变成可用上下文

RAG,也就是检索增强生成,经常被说成一种独立技术。但从提示词和上下文的角度看,RAG 的逻辑很直接:先从外部知识库找到相关资料,再把这些资料作为上下文提供给模型

模型本身的知识可能不够新,也不一定包含某个企业内部资料。比如企业制度、产品手册、合同条款、课程教材、客户资料,这些内容未必存在于模型参数里。RAG 的作用,就是把外部知识临时加入上下文,让模型基于这些材料回答

但 RAG 不是简单“搜一堆资料塞给模型”。它至少包含几个环节:文档如何切分,问题如何检索,片段如何排序,重复内容如何去掉,低质量资料如何过滤,资料如何放进提示词,模型如何被要求”仅基于资料回答”,资料不足时如何说明无法判断

检索到的资料不相关,模型就会基于错误上下文回答;塞入资料太多,模型会被噪声干扰;没有规定引用或依据,模型可能把资料和自身推测混在一起

因此,RAG 的重点不在于“有知识库”,而在于“把正确知识以正确方式放进上下文”

✎ 第九层:Agent 是让模型在上下文、工具和状态之间循环工作

Agent,也就是智能体,看起来比普通聊天复杂很多:它可以规划任务、调用工具、读取文件、搜索资料、执行代码、检查结果、继续下一步

但从底层看,Agent 仍然离不开提示词和上下文

普通提示词主要告诉模型”回答什么”。Agent 提示词还要告诉模型:什么时候行动,调用什么工具,如何判断结果,失败后怎么办,任务完成标准是什么

例如,一个写报告的 Agent 可能会经历这样的流程:

代码块

理解任务 → 制定计划 → 检索资料 → 阅读资料 → 提取信息 → 生成初稿 → 自我检查 → 修改输出

每一步都需要上下文支持。模型要知道当前任务是什么,已经完成了什么,工具返回了什么,还有什么没做,下一步应该调用哪个工具

也就是说,Agent 的形成,来自系统把模型、工具、状态和记忆组织成一个循环执行流程。模型没有突然拥有独立意识,它只是被放进了一个可以持续行动的系统里

所以,Agent 的稳定性不只取决于模型能力,还取决于提示词是否清楚、工具说明是否明确、状态记录是否可靠、失败处理是否完善。如果没有这些设计,Agent 很容易反复调用工具、忘记任务目标、被无关信息带偏,或者在中间步骤出错后继续编造结果

✎ 第十层:Token 决定模型一次能看见多少,也决定成本和噪声

所有上下文最终都会被模型处理成 Token。Token 可以粗略理解为模型处理文本和信息的基本单位,但它不等于汉字数,也不等于英文单词数。不同模型的分词方式不同,同一段话在不同模型中可能被切成不同数量的 Token

Token 重要,是因为它决定了几个很实际的问题

首先,它决定上下文窗口。模型一次能处理的信息不是无限的,系统提示、用户问题、历史对话、检索资料、工具说明、输出内容都会占用 Token。前面塞得太多,后面就可能没有足够空间生成答案

其次,它决定成本。很多模型按输入 Token 和输出 Token 计费,提示词越长、历史保留越多、检索资料越杂,成本越高

再次,它影响速度。上下文越长,模型处理时间通常越长,响应可能越慢

最后,它影响质量。很多人误以为上下文越长越强,其实未必。长上下文里如果充满重复信息、无关资料和冲突指令,模型反而更容易混乱

所以,Token 管理的重点不是省字数,而是提高信息密度。真正好的提示词,应该在有限 Token 里放入最有用的信息:任务目标、必要背景、核心材料、示例、约束和输出格式

✎ 把这些原理串起来看

如果把上面的内容连起来,提示词工程的底层主线其实很清楚:

代码块

模型通过上下文生成

提示词负责构造任务化上下文

任务重表述:让模型知道要做什么

上下文学习:让模型通过示例临时掌握模式

RAG 把外部知识加入上下文

Agent 把工具、状态和行动流程加入上下文

Token 决定上下文的容量、成本和边界

所以,大模型交互可以理解为:人类或系统把任务、材料、规则和工具组织成上下文,模型在这个上下文中生成下一步结果

这也解释了为什么有些人用大模型效果很好,有些人效果很差。差距不一定在于谁会写更花哨的提示词,而在于谁更会定义任务、组织上下文、提供示例、控制格式、管理 Token、引入可靠资料,并设计可检查的输出流程

提示词工程的真正能力,是把一个模糊需求变成模型可以执行的任务执行环境。你给模型一个混乱环境,它就只能在混乱里猜;你给模型一个清晰环境,它才有机会稳定完成任务

大模型本质上很简单。很多时候,它的表现取决于你把任务讲清楚到了什么程度。你给它一堆杂乱材料,它就像临时接手项目的人,边看边猜;但你把目标、材料、规则和交付格式都说清楚了,它就更像一个拿到完整任务说明的协作者

如果你觉得这篇文章对你有帮助,欢迎点赞收藏,也欢迎转发给正在学习AI的朋友,如果你有任何想法或问题也可以私信或评论区留言,我们下篇见

本文为原创,版权归作者秋孝隱所有。未经授权,任何个人、平台、媒体或机构不得以复制、转载、摘编、改写、搬运、截图、录屏、洗稿等形式使用本文内容;如需转载或合作,请先通过后台留言或私信联系作者,获得明确授权后方可使用,并在转载时注明作者及出处

本文由 @秋孝隱 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议