惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

GbyAI
GbyAI
博客园_首页
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
阮一峰的网络日志
阮一峰的网络日志
酷 壳 – CoolShell
酷 壳 – CoolShell
博客园 - 司徒正美
V
V2EX
Cloudbric
Cloudbric
Hugging Face - Blog
Hugging Face - Blog
腾讯CDC
量子位
博客园 - 三生石上(FineUI控件)
博客园 - 叶小钗
K
Kaspersky official blog
博客园 - 【当耐特】
T
Tenable Blog
L
Lohrmann on Cybersecurity
The Cloudflare Blog
S
Schneier on Security
A
Arctic Wolf
Latest news
Latest news
C
Cyber Attacks, Cyber Crime and Cyber Security
罗磊的独立博客
T
The Exploit Database - CXSecurity.com
Cisco Talos Blog
Cisco Talos Blog
小众软件
小众软件
P
Privacy & Cybersecurity Law Blog
WordPress大学
WordPress大学
Simon Willison's Weblog
Simon Willison's Weblog
雷峰网
雷峰网
NISL@THU
NISL@THU
人人都是产品经理
人人都是产品经理
月光博客
月光博客
J
Java Code Geeks
V
Visual Studio Blog
S
Security Affairs
博客园 - Franky
T
Tailwind CSS Blog
Apple Machine Learning Research
Apple Machine Learning Research
H
Heimdal Security Blog
有赞技术团队
有赞技术团队
V2EX - 技术
V2EX - 技术
AWS News Blog
AWS News Blog
G
GRAHAM CLULEY
T
Troy Hunt's Blog
SecWiki News
SecWiki News
Spread Privacy
Spread Privacy
宝玉的分享
宝玉的分享
www.infosecurity-magazine.com
www.infosecurity-magazine.com
博客园 - 聂微东

GbyAI

企微、个微机器人调研 AIPM角度对于deepseek-r1的解读 Claude MCP 小示例以及一些想法 comfyui官方桌面版V1尝鲜 Creating a LLM-as-a-Judge That Drives Business Results 浅析AutoGLM LLM经典paper傻瓜式速读(持续更新) o1 我常用的极品提示词hhh 分享平时觉得比较好用的RSS订阅&&一键导入目前我订阅的源 linkedin 做 agent 的一些建议 现阶段做智能客服 agent 的复盘(持续补充) AIPM技能树 ToC端医美AI伴侣产品-简述(一期) LLM越来越长上下文的一些简单思考 有关 Sora 的一些思考和理解 汇总26个提示词工程技巧 读《人工智能 agent 勘测多模态交互的前景》 读《王慧文清华产品课》 LLM 智能客服 PK 传统智能客服 李想产品实战16讲 自用稳定快速ChatGPT VPN 使用 API 和 Node 创建带有复杂后端逻辑的 GPTs(译) 手递手教你 Obsidian 笔记建站 如何使用虚拟卡升级 Chatgpt Plus 和 Api OpenAI Translator 介绍 + 两个中英互译 Prompt 医美垂直领域智能客服agent搭建说明书(万字长文) 友情免费提供使用 ChatGPT py 自动抓取微信群消息 关于我 友链
AI瞎想碎片化思考系列之agent构建
hellloveyy · 2024-08-13 · via GbyAI

对目前市面上构建 agent 的平台和工具的一些思考

目前构建 agent 的产品形态越来越丰富了:

  • 编码(langchain,metagpt)
  • 拖拽工作流+插件(coze,dify,comfyui)
  • 画布(flowith,glif)
  • Prompt(gpts,glms)
  • 文档(wordware)

最近 Product Hunt 上大火的 Wordware,其目的是降低 agent 构建门槛,让创建 agent 像 notion 文档一样简单,不需要懂 workflow、不需要懂代码即可完成复杂的 agent 构建。

列举一下目前比较火的其他 agent 构建平台

  • GPTs
  • coze 以及类似大厂推出的平台(ModelScope,飞桨等)
  • dify
  • fastgpt
  • glif
  • AutoGPT 最新版支持模块化设置
  • Comfyui_LLM_party 以 comfyui 的形式构建类似 dify 的 agent 工作流
  • ...

是不是眼花缭乱,但是其实这些平台的目的也是为了降低构建 agent 的门槛,但是自从这些平台初始推出至现在,我就一直在想这类产品的构建者用户群体到底是谁呢?

是对 AI 有兴趣的普通人吗? 好像不是,因为对于这些人来说光是理解代码、工作流、记忆、变量等,这些概念就得好一阵子了

是专业的 LLM 研发工程师? 好像也不是,因为他们看不上这些玩意儿,太低级了😁

那究竟是谁呢? 我仔细想了想,代入了一下自己。好像更多的是我们这些 PM 渣渣,用来满足自己对于 AI 的一些探索乐趣,同时做一个 MVP。

最早的 agent 构建工具是 GPTs,通过自然语言描述来生成一个 agent 同时也带来了提示词工程的兴起。但是有一个弊端就是不可控,那时候即使在提示词中写好了 workflow 也有一大定的几率不按照规则去执行,尤其是较差的 LLM 那更是忽略你的 prompt 跟吃饭一样(比如那时候的文心一言 hhh)

最早在 dify 没有出来的时候我就在想,现在通过 langchain 构建 agent,对于小公司以及非 LLM 研发来说门槛过于高了,应该来做一款平台类的产品,让大家更专注于自己的思维,从而做出属于自己内心的 agent 产品。

后来 dify、fastGPT 来了,打着开源化 agent 部署平台的旗号,确实很好用解决了很大一部分小公司的需求,并且流程大部分可视化。

随着 coze 的大兴起(主要是那时候佛光普照 com 版本免费用 GPT4 接口呀),workflow 的设计也越来越严谨,加入了变量、记忆等等功能。可是我觉得并没有带来构建者用户群体的变化,反而门槛越来越高了😁

很早之前我就在想究竟这类产品的用户是谁?怎么才能让这类平台性质的产品更好用呢?能不能更 LUI?

某一天,想到“每个人都能自由便捷的构建 agent 才是最好的 agent platform“,在开车突然灵感一飘而过,年龄大了记忆力不好赶紧记下来。

(...忽略一些杂七杂八的玩意儿)

然后果然还是忘了,前两天看到 Wordware,突然想起来自己还留了一个代办呢😭

体验了一下 Wordware 感觉距离我脑海里的东西很近了,很 LUI。

抽时间想了想并且把我当前脑海里面最好的 agent 构建平台是什么样子大概画了一下图。

  • 为什么是流程图?

    • 首先你得清晰的知道自己要的是一个什么流程,才能把这个流程复现出来,即使只是一个粗略的流程图,也可以不断的根据你的思路去细化,把脑海之中要做的 agent 具象化出来。
  • 技术难点

    • 平台前置不同的功能模块作为 tools
    • 通过 LLM 准确判断涉及的功能模块
  • 生成流程图可以用 Mermaid 代码

其实我们最终要做的 Agent 就是把脑海里面的内容原封不动搬出来,不是吗? 真正做一个业务应该是,产品配合金牌业务,去绘制脑海中的工作流并完善,最后交付给研发去实现。并且要和业务密切关注使用结果,以便迅速迭代。 产品不一定是最懂业务的,产品需要做的是从业务脑子里面分解归纳出,结构更合理的工作流