惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

SecWiki News
SecWiki News
I
InfoQ
The Cloudflare Blog
人人都是产品经理
人人都是产品经理
博客园 - Franky
T
Tailwind CSS Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
博客园_首页
罗磊的独立博客
V
V2EX
李成银的技术随笔
大猫的无限游戏
大猫的无限游戏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
True Tiger Recordings
Vercel News
Vercel News
Cyberwarzone
Cyberwarzone
Cisco Talos Blog
Cisco Talos Blog
F
Fox-IT International blog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
M
Microsoft Research Blog - Microsoft Research
Know Your Adversary
Know Your Adversary
爱范儿
爱范儿
The Register - Security
The Register - Security
G
Google Developers Blog
The Hacker News
The Hacker News
Malwarebytes
Malwarebytes
S
Securelist
博客园 - 三生石上(FineUI控件)
Jina AI
Jina AI
T
Threat Research - Cisco Blogs
T
The Exploit Database - CXSecurity.com
S
SegmentFault 最新的问题
博客园 - 叶小钗
F
Fortinet All Blogs
Apple Machine Learning Research
Apple Machine Learning Research
宝玉的分享
宝玉的分享
博客园 - 聂微东
T
Threatpost
博客园 - 【当耐特】
D
Docker
P
Privacy & Cybersecurity Law Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
G
GRAHAM CLULEY
V
Visual Studio Blog
C
Cisco Blogs
IT之家
IT之家
S
Security Archives - TechRepublic
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志

一颗小树

小树的 2025 年终总结 AI 下半场 MobX 核心机制探究 如何快速融入新团队 习惯养成的一点新实践 阿里七年,小树毕业了 小树学装修 - Mesh 组网 为什么忙起来就没有表达欲? 昆明风光好 和 deepseek 创作悬疑短篇 基于大模型搭建内容输出工作流 小树的 2024 年终总结 因地制宜 底层逻辑 不要轻易给自己贴标签 在天津随机漫步 如何通过售卖 Notion 模板获得收入 多维表格的边界 平淡日子里的闪光碎片 驾照加载中 河山大好出去走走 “我们”共同的烦恼 长周期的反馈指标 白河溯溪里收获的时代性 从竞争者到合作者 和客户面对面交流 奔波中的六月 内蒙古赤峰草原之行 我为什么不记账了 周末随想 从客户视角出发 我的职业价值观 扔掉心里的锚 骑行小记 用多维表格实现高质量需求交付 黄山:穿越云雾的山水诗篇 允许自己放空 春日老友记 Cubox 导出至 Obsidian 的工作流优化 让时间慢下来 Sam Altman 对提高个人生产力的建议 精读《GPT4 Technical Report》 AI 带我读论文 让世界更好一点点 改变学习方法 小树的 2024 年计划 小树的 2023 年终总结 小树的 2023 书单 周更的第 100 篇 改变阅读方式 宝贵的人生建议 小树的工具库 2023 读《重构》有感 仅需 10 分钟,用 GPTs 实现文章总结助手 高质量的需求交付 产品始于问题,而不是解决方案 如何更好地休息 最优解人生 租房和生活选择权 搬家整理小记 更适合我的时间管理方式:时间盒 与体重斗,其乐无穷 结构化 prompt = 数字员工? 持续创作的法门 如何降低知识焦虑 7 月思维碎片 N 倍生产力提升:我的 AI 助理 Indie Hacker,互联网打工人的下一个出路? 如何成就伟大事业 夏日碎片 小报编辑的自我修养 提升信噪比:过滤有价值信息的方法 干一行爱一行 提高生活的满足感 做好时间管理的几个建议 差旅杂记 如何快速适应自己不擅长的工作 Make Things Happen 消费的科学与艺术 推荐几本最近读的书 表达的前提是经历 Gradually then suddenly 投资没有最好,只有最适合 投资,是为了更好地生活 如何对待事务性任务 如何打造自己的核心竞争力 把手弄脏:细节藏在过程中 述职之后:见他人和见自己 给 flomo MEMO 做一次断舍离 个人知识管理的困境与改进 Astro 搭建个人博客 一颗小树 #49 投入真实生活 一颗小树 #48 过年杂记 一颗小树 #47 我的人生信念(2023) 一颗小树 #46 回本就卖 一颗小树 #45 规划和落地 小树的 2022 年终总结 一颗小树 #44 构建高质量信源 一颗小树 #43 我的 2022 书单 一颗小树 #42 阳了怎么办
做了几个月大模型产品,我学到了什么
2023-09-10 · via 一颗小树

你好,我是小树。这是我为你写的第 80 封信。每期都会同步更新在微信公众号一颗小树竹白专栏。现在有 330 位朋友订阅了这封信,也欢迎你。

最近几个月一直在深度参与大模型在协同文档产品中的落地,大概是也是目前国内对大模型应用最拥挤的领域之一,分享一些我的感受和体悟。

大模型在垂直场景中的应用

讲到大模型的应用场景,就不得不提到一个很容易犯的错误:

眼里只有大模型这把锤子,在满世界寻找钉子。

OpenAI 向全世界展示的能力确实足够惊艳,但如果具体到 toB 的业务场景,向让客户买单,首先要讲清楚的就是大模型究竟能为用户解决什么问题。

是希望让 AI 彻底替换人类工作?

还是期望靠 AI 就能够获得竞争优势,打败竞争对手?

还是期望 AI 能够解决所有遇到的问题?

都不是。

无论是传统行业,还是互联网行业,大家需要 AI 的本质需求依然是降本增效。

因此,在 toB 产品的语境下,先想清楚产品为客户提供的核心价值,再去思考当前产品的瓶颈是否可以借助大模型去打破。

toB 产品常见的问题有功能点繁多、使用链路冗长、使用方法复杂难上手等,针对这些具体的场景,有的放矢地去进行改良,会更容易取得效果。

从技术的角度讲,在常规的内容生成的能力之外,如果想要进一步理解用户意图并执行某些操作,通常需要借助大模型来生成结构化的描述,流程可以简要概括为:

用户需求 => 大模型理解 => 结构化返回 => 已有 API 能力

这也是我在看到 GPT 支持 function calling 特性之后非常兴奋的原因。

在垂直场景中,我们更需要的是大模型对用户需求的理解和转化能力,而不需要直接产出最终的结果。

中间往往都需要经过一层结构化的描述作为桥梁连接大模型和现有的应用,这一层具体是什么结构不重要,YAML、JSON 或是 JavaScript 代码都可以,只要两边都可以识别并消费就可以。

大模型的能力边界

在国内,使用生产环境可用的大模型需要接受明显的能力落差,这不只是国内大模型的问题,而是第一梯队的大模型具有明显的能力代差。

以 GPT4 为例,在垂直场景下,仅仅通过 prompt 工程,国内的大模型还远远达不到像 GPT4 一样的可用性。

这意味着在自己的业务场景下,需要对模型进行微调,而微调的关键是优质的训练集和验证集,也就是训练数据

这一点是目前国内大模型在垂直场景应用的主要瓶颈,换个角度看,也是核心竞争力。

如果基于 GPT4 的能力去尝试验证产品的思路,再切换至国产大模型实现产品链路,会有非常明显的落差感,在产品交互和工程上就需要做出很多的妥协。

同时,和实际使用过大模型能力的用户交流发现,能准确用 prompt 表达自己的需求的门槛并不低,很多时候问题无法被快速解决是因为提的问题本身就不对。

因此所有大模型的应用都会在 prompt 上下功夫,比如模版、自动补全等等能力,以期望用户能够尽可能准确地表达自己的诉求。

这往往会让 prompt 变得复杂,如果一个融合大模型了产品,用户学习 prompt 的成本比学习实现产品功能本身还要高,说明这个产品是不够好的。

当然,这里的前提是需求和能力已经存在,而不是由于大模型的出现创造出了新的需求。

结合我之前提到过的结构化 prompt 的思路,当下更好的方式可能是提供更多的约束条件,让用户明确自己的使用场景和需求,进而提高结果的准确率。

具体的交互形式可以自由选择,最常见的就是表单的方式来收集需求信息。

更明确的需求输入和相对更准确的结果输出,在用户体验上,会比功能边界模糊不清的产品更好。

如果一个功能免费向用户开放,但依然每天的使用人数和留存很低,要么是需求本身有问题,要么是功能本身还远远达不到用户的预期。

最后,讲两个我个人的观点:

  1. 我认为微软把结合大模型的能力称为 copilot 在当下是非常精准的,AI 只是我们的副驾,掌控飞行决策的依然是我们自己。
  2. 我不认为大模型会成为 toB 产品的核心能力,它应当是在产品已有的上下文中,打破以往难以突破的某些瓶颈,作锦上添花之用。

如果离开了这个上下文,它的价值会大打折扣。

如果你有不同的见解,或者其他想要交流的,欢迎加我微信 alittletree2021 详聊。

碎碎念

周末尝试了一下北京的费大厨辣椒炒肉,给我的感觉是店家花在营销和口味上的精力是五五开。

从叫号开始,到服务端领我们入座,再到上菜,都在不停强调所谓「全国第一」的品牌价值。

但综合味道、性价比以及服务,还是挺值得一去的。

谢谢你的关注,我们下期再见。👋🏻


往期推荐

你也可以在这里找到我:即刻Twitter、微信公众号一颗小树

如果你觉得这篇文章对你有用,欢迎分享给更多好友。