惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

D
DataBreaches.Net
O
OpenAI News
U
Unit 42
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Microsoft Security Blog
Microsoft Security Blog
博客园_首页
博客园 - Franky
H
Hackread – Cybersecurity News, Data Breaches, AI and More
博客园 - 叶小钗
Hugging Face - Blog
Hugging Face - Blog
V
Visual Studio Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
量子位
博客园 - 司徒正美
大猫的无限游戏
大猫的无限游戏
Microsoft Azure Blog
Microsoft Azure Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Apple Machine Learning Research
Apple Machine Learning Research
人人都是产品经理
人人都是产品经理
爱范儿
爱范儿
小众软件
小众软件
腾讯CDC
G
Google Developers Blog
博客园 - 【当耐特】
F
Fortinet All Blogs
阮一峰的网络日志
阮一峰的网络日志
S
SegmentFault 最新的问题
Martin Fowler
Martin Fowler
酷 壳 – CoolShell
酷 壳 – CoolShell
Vercel News
Vercel News
Stack Overflow Blog
Stack Overflow Blog
博客园 - 聂微东
C
Check Point Blog
罗磊的独立博客
Jina AI
Jina AI
WordPress大学
WordPress大学
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
A
About on SuperTechFans
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
J
Java Code Geeks
Y
Y Combinator Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
IT之家
IT之家
B
Blog
有赞技术团队
有赞技术团队
GbyAI
GbyAI
Last Week in AI
Last Week in AI
V
V2EX
月光博客
月光博客
宝玉的分享
宝玉的分享

少数派

派早报:Google 发布 Fitbit Air 等 - 少数派 「新人报到」確認需求,再開始 - 少数派 从 SOLO 独立开发者社区,我看到了越来越多开发者开始做自己的产品 - 少数派 我怎么管理那些"不常做,但总会忘"的生活事项 - 少数派 人形机器人量产元年,数据才是具身智能的“生死线” - 少数派 BuhoLaunchpad 高度还原 Mac 启动台:开发历程与思考 - 少数派 五年陪伴依然不舍,DIY 换壳后让罗技 MX Master 3 继续服役 - 少数派 新玩意 240|少数派的编辑们最近买了啥? - 少数派 一日一技|为什么你应该关闭 iOS 的键盘声音 - 少数派 我做了个插件和 Skills,一键提取任何网站的设计规范 Design.md - 少数派 住在三四线城市的你,该开始录播客了 - 少数派 甘南秘境,大白高国 - 少数派 AI的审美:谁让把我变成川内倫子 - 少数派 返工怎能不烦恼,打工人片单总有一部是你的「嘴替」 - 少数派 为了让「上厕所」更健康,我做了一个小工具 - 少数派 AI + Skill,能够让生成的文章去除 AI 味吗? - 少数派 新玩意|韶音OpenDots ONE 耳夹式耳机 - 少数派 《美满》| 在每一个春天的晚上相爱(362) - 少数派 新玩意|优篮子 PS01 MagSnap 磁吸支架 - 少数派 自我整合手记 | 我开始早睡了:用稳定规则,为自由托底 - 少数派 用龙虾(OpenClaw)两个多月,我最深的12个体会 - 少数派 听歌时间到,12 张你可能错过的 2025 华语乐坛好专辑 - 少数派 承诺能追吗 - 少数派 macOS 26启动台没了? 我做了个不一样的App启动器 - Keboard - 少数派 《四海为家的人》| INTJ对话INTJ(361) - 少数派 你发过的那些黑历史,是时候一次清干净了 - 少数派 新玩意:安安静静玩,越玩越专注:计客密码机 - 少数派 iPad 用户首次体验 Android 平板:vivo Pad6 Pro - 少数派 数据逻辑强 - 少数派 极北行+ | 一路向北,探访日本至北之地 | 001 - 少数派 万字剖析:千问App深度体验报告(2026) - 少数派 在2026年,如何真正防止别人抄袭你的作品 - 少数派 怎么用 50 块搭个 AI 语音助手?我踩了 3 天坑 - 少数派 YeeroAI:让 AI 对话真正成为知识管理的一部分 - 少数派 爬泰山 - 少数派 「旅图显影」 App 更新:这次,我们补上了一点「手感」 - 少数派 假期出门太折磨?我的 23 条经验帮你规划惬意旅行 - 少数派 工作流会变吗 - 少数派 Claude Opus 4.6 怎么用最省钱?我测了 5 种方案 - 少数派 GPT Image 2 让图文并茂不再稀罕 - 少数派 用户侧出发——什么是AI,我要不要学习? - 少数派 找片、转存、整理、播放一条龙!让你的付费网盘值回票价 - 少数派 欢迎试用!日课一问2.0插件 - 少数派 自己做的MDeditor,原本想购买 Typora 试了两次支付不成功,干脆自己做一个 - 少数派 vibe coding了一个 3MB 的小工具,让 ~/Downloads 彻底告别混乱 - 少数派 因为受不了 Mac 的风扇策略,我做了一个风扇控制工具 - 少数派 别只怪模型 - 少数派 Warp 终端的 AI 功能怎么用?我测了一周的体验 - 少数派 AI 写代码老是出 bug?这 5 个配置我后悔没早知道 - 少数派 「新玩意」苹果出相机可能就这样:Sigma BF + 45mm F2.8 DG Contemporary - 少数派 一个面向2030年的AI操作系统是什么样子的:浅谈cola这款有灵魂的Agent - 少数派 别只看写代码 - 少数派 每天解决10个问题,还是一口气攻坚解决400个? - 少数派 AI 交易机器人怎么搭?我用 Claude 跑了一周实盘 - 少数派 Maptoposter Online:把你爱的城市画成艺术海报 - 少数派 Function Calling 怎么用?我测了 3 个模型发现差距真大 - 少数派 Legend Talk:我做了个 AI 圆桌,让 160 位思想家围着你的问题转 - 少数派 如何找到自己的蓝方?在小县城寻找压力测试 - 少数派 语音输入与软件接口|2026年聊AI时,我们都聊些什么(上) - 少数派 混动已经卖爆,纯电又来补刀——钛7闪充版简直“不讲武德” - 少数派 本月玩什么|朋友收藏、识质存在、沙罗周期 - 少数派 为什么要每天坚持输出? - 少数派 Claude API 挂了好几个小时,你的项目有备用方案吗? - 少数派 Function Calling 没你想的复杂——我用它做了个有点用的工具 - 少数派 登录系统立即播放视频或者图片音乐的软件 - 少数派 我为什么创建 FlipHTML5 下载工具 - 少数派 残局没电?多品牌外设电量统一管理软件EasyBluetooth已支持RTSS游戏内显示以及AIDA64 - 少数派 前往通义路的路 - 少数派 太好看了,媲美Sun的个人导航页,NAS部署星云门户 - 少数派 乌黑嘴唇“一键检测”上线了 - 少数派 派早报:Claude AI 接入多个创意软件生态、FILCO 生产方接手品牌等 - 少数派 【更新】BearCLI、Claude 连接器与 MCP 服务器 - 少数派 记了上千条流水,还是看不懂财务?我做了一个让 AI 读懂账本的工作台 - 少数派 MINI R56 升级原厂 Sport 模式 - 少数派 新玩意 | 一棵柠檬树(仿真版) - 少数派 Momenta的“物理AI”野望,需迈过“含摩量”这道关 - 少数派 网页直接投屏控制手机!NAS一键部署PandaScrcpy,流畅丝滑可远程。 - 少数派 众测|邀你一同探索随身 AI 硬件入口 YoooClaw C·ONE - 少数派 2050大会:分享时间是真诚 参会记 - 少数派 iPad 赋能电影创作:国内首部宣纸手绘长片《燃比娃》的幕后故事 - 少数派 AI的审美:我用 8 个大模型给 100 张旅行照片打分 - 少数派 普通人如何破圈?去参加一个本地协会 - 少数派 把极空间的图标全换了,主题DIY全攻略打造你的专属NAS桌面 - 少数派 电子便签墙,帮你实现便签自由 - 少数派 我如何用三个 CLI 工具取代文档创建需求 - 少数派 原来真的有人可以玩一辈子 - 少数派 社区速递 139 | 派友热议三月买了啥、复古单反尼康 Df 体验 - 少数派 06 作品的赏析与评价 - 少数派 TDS REVIEW|索尼 WF-1000XM6 降噪真无线耳机体验 - 少数派 35.98万起售的第二代腾势D9,我看重的不是堆料,而是不凑合 - 少数派 鼠须管 Squirrel 皮肤配置指北 - 少数派 从watch ultra2换到redmi watch6 - 少数派 派早报:阿里巴巴发布视频生成模型 HappyHorse 1.0 等 - 少数派 别迷信1M - 少数派 家人们天塌了!网盘“大封杀”,多个渠道多条路,NAS部署PanHub - 少数派 AI与人勾心斗角!NAS一键部署AI狼人杀,假日休闲必备。 - 少数派 电商必备!Comfyui工作流批量生图插件,一次生成12张!支持Nano banana pro模型 - 少数派 Comfyui工作流配置Gpt-image-2模型教程,0.03/张 - 少数派 OpenClaw第三方APi怎么配置?可使用Gpt-image-2模型 - 少数派 会员社区话题精选 Ep. 103 - 少数派
千万不要直接用AI,真正帮你高效完成工作的是工作流 - 少数派
2024-07-25 · via 少数派

引言

在这个信息爆炸的时代,AI工具正以飞快的速度涌入我们的工作和生活。许多人期待这些工具能够显著提升我们的工作效率。然而,单一的AI工具所能带来的提升效果往往有限。实际上,真正能够帮助我们提升效率的是一个集成了多个AI工具协作的AI工作流。一个有效的工作流不仅能够简化操作,还能最大化利用AI的能力,实现真正的效率提升。

例如,在公司的素材池的扩充过程中,从素材生成到审核,再到入库,多个节点有没有可能将这些节点合并,用AI多节点甚至一站式解决?又例如,当老板让你总结会议纪要,并将其会议纪要整理成思维导图,有没有什么办法可以快速搞定?

为什么要设计AI工作流

在AI应用中,解决问题的核心不在于单一的工具或模型,而在于设计一个适合AI的工作流。以下是设计AI工作流时需要考虑的几个因素:

  • 简化复杂任务:通过设计工作流,可以将复杂任务拆解为更易管理的子任务,从而提高任务的可操作性和成功率。例如,通过将文档处理分为文本提取、分析、处理和输出四个步骤,可以更好地管理每个步骤的质量。
  • 提高效率:工作流可以自动化重复性任务,从而节省时间和人力。例如,通过自动化数据清洗和预处理,可以将数据分析师的时间解放出来,专注于更具价值的分析工作。
  • 增强灵活性:设计工作流可以使系统更加灵活,能够适应不同的需求变化。例如,通过模块化设计,可以根据需要灵活调整或替换某些步骤。
  • 确保一致性和可靠性:工作流可以标准化操作流程,确保每次执行的结果一致,从而提高系统的可靠性。例如,通过标准化的文本处理流程,可以确保不同来源的文本处理结果一致。

案例:素材扩充入库工作流

在设计团队中,素材管理是一个重要的环节。以下是一个素材扩充入库的AI工作流:

第一步:素材GC:使用sd、mj等生图工具生成图片素材。

第二步:素材审核:使用GPTs对素材进行筛选,去除低质量或重复素材。

第三步:素材自动打标:使用GPTs对素材进行自动打标,生成标签和信息填充。

第四步:素材入库:将处理好的素材批量入库。

第二步:素材审核
第三步:素材自动打标

一个完整的AI工作流,每个节点都有AI赋能提效,自动化+批量化的能力可以极大地节省时间成本。

一个GPTs多步骤 vs 多个GPTs

在探讨GPT的使用时,一个有趣的话题是在项目中用单个GPTs多步骤完成任务,还是使用多个GPTs协同来完成任务?哪种形式更高效,让我们来深入了解这两种方法的优缺点:

一个GPTs多步骤

优点

  • 资源节约:一个GPT可以在一个上下文中完成多个步骤,最大化节约计算资源和时间。
  • 操作简便:无需切换多个模型和接口,只需一次调用即可完成所有任务。
  • 适用范围广:适用于各种需要连续处理的场景,如翻译、总结等。

缺点

  • 灵活性低:中间结果不能轻易修改,限制了人工干预的可能性。
  • 上下文限制:处理复杂任务时,可能会因为上下文长度限制而影响结果质量。
  • 模型要求高:对模型的理解和执行能力要求较高,需要强大的模型支持。

多个GPTs

优点

  • 灵活性高:可以对每个步骤的中间结果进行处理和调整,增加人工干预的灵活性。
  • 专注性强:每个GPT专注于完成一个特定任务,提示词编写和调试更为简单。
  • 模型组合:可以混合使用不同模型,根据任务需要选择最合适的模型,提高整体效率和效果。

缺点

  • 资源消耗大:需要多次调用不同的GPT模型,增加计算资源和时间成本。
  • 复杂度高:需要额外的代码和逻辑处理各个GPT之间的交互,增加系统复杂性。
  • 适用性有限:在某些应用场景下,可能无法直接使用多个GPT,需要额外的集成和协调工作。

以吴恩达老师的翻译Agent作为案例,多个GPTs,整个过程不是在一个 Prompt 中完成,而是有三个GPTs分别完成直译、反思和意译,每个GPTs都有独立的 Prompt。

为了方便大家理解,我以“Never put off till tomorrow what you can do today.“为投喂需求,做个清晰的感知:

以下是一个GPTs完成多步骤翻译的示例:

输入

请按照直译、反思和意译的步骤,翻译下面这句话:
Never put off till tomorrow what you can do today.

输出

1. 直译:
   今天能做的事,永远不要拖到明天。
2. 反思:
   这句话在中文中传达了不要拖延的意思,但表达稍显冗长。
3. 意译:
   今日事今日毕。

以下是使用多个GPTs分别完成直译、反思和意译的示例:

直译GPTs

请翻译这句话:
Never put off till tomorrow what you can do today.

输出

今天能做的事,永远不要拖到明天。

反思GPTs

<SOURCE_TEXT>
Never put off till tomorrow what you can do today.
</SOURCE_TEXT>
<TRANSLATION>
今天能做的事,永远不要拖到明天。
</TRANSLATION>
请检查上面的翻译,反思其中存在的问题,输出仅包含问题列表。

输出

1. 翻译表达了原文的意思,但显得冗长。
2. 直译的结果在中文中不够简洁。
3. 需要更简洁有力的表达方式。

意译GPTs

<SOURCE_TEXT>
Never put off till tomorrow what you can do today.
</SOURCE_TEXT>
<TRANSLATION>
今天能做的事,永远不要拖到明天。
</TRANSLATION>
<EXPERT_SUGGESTIONS>
1. 翻译表达了原文的意思,但显得冗长。
2. 直译的结果在中文中不够简洁。
3. 需要更简洁有力的表达方式。
</EXPERT_SUGGESTIONS>
请根据直译和反思的结果,重新意译,并输出最终翻译结果,不包含任何其他信息。

输出

今日事今日毕。

通过对这两种翻译工作流的分析,可以看出,使用多个GPT方法时,每一步的输出都可以进行检查和调整,灵活性更高,允许人工干预以提高翻译质量,但需要额外的交互,增加了操作复杂度。而单一GPT多步骤方法在效率和资源消耗上更具优势,适用于快速且资源受限的环境,但灵活性较低,难以中途修改输出。最终,选择哪种方法应基于具体应用需求、资源可用性以及对翻译质量和灵活性的要求。

两种方式没有哪个更好用,要看实际的应用场景。


上面只是一些示例的讲解,可能有些同学没有很强的体感。我分享一个我一直在用的工作流吧,是针对会议对焦、评审时的纪要整理或者是项目改动排期时经常用的工作流。

因为我是属于那种开会说的全都懂,散会内容全都忘的选手,老板让我去整理会议记录,属实是难为我了。

因此会议录音是我每次开会必备,而后我下去反复再听录音,整理出牵扯到我需要改动的点。但是有时候开倍速吧,重要的点又容易错过;不开倍速吧,有的会议前端长篇大论、设计侃侃而谈,非常浪费时间。因此我想着为什么不能让GPT帮我整合梳理出会议的内容,于是炼制了GPTs:会议纪要助手。而后配合一些其他的AI工具网站创建会议整理工作流:

录音转文本-投喂GPTs

第一步:将开会录音从音频转为文字

第二步:进行会议纪要总结

第三步:转变成思维导图

第一步:转文本

这一步很多工具网站都能做到。我在体验多个工具后,还是推荐用讯飞听见。这里就不给它打广告了哈,可以自行体验。当然也可以用飞书妙记、通义听悟等平替工具,效果都还不错。

如果你已经有了录屏或者录音,那就直接上传音视频就行。包括在手机上进行快捷操作,直接发送到手机端软件进行转换。这里我就拿最近的热议话题:萝卜快跑。我在某音上下载了一个博主的解说视频,直接上传。

上传并提交转写
转写结果

讯飞转写的精准度还是非常高的,哪怕是一些生僻冷门的词汇,它也会根据上下语境判断并精准转写。你也可以点击右下角的「需要人工校准?」做二次调整,会去掉人说话时的语气后缀,特别是在一些会议或者直播中,自然是需要把这些语气词去掉,精练化。读起来也会比较通顺。

下载文本.txt

我觉得电脑端可以直接全选复制会更加方便,手机端的话可以下载TXT发送到GPT上。

全选复制

第二步:会议纪要总结

复制后打开GPT,@我们的会议纪要助手(GPTs),考虑到有部分同学目前没有渠道购买GPT,我还去智谱清言上部署了一个类似的小助手,可以体验下。

直接投喂给GPT
格式转化

当确认内容无误后,让GPT以Workdown格式输出,这一步偶尔还会出错,在Prompt中需要明确输出规则,最终输出以Workdown格式、css窗口进行输出

第三步:转变成思维导图

神器推荐Markmap 🌟🌟🌟

Markmap预览

直接把输出的Workdown格式的内容粘贴在左边,右边会实时出思维导图的预览。

工具推荐妙办 🌟🌟🌟🌟

妙办预览

AI对话的形式辅助思维导图的产图,我们也可以将我们的Workdown格式内容发送给它,大概等待20s左右,在画布中就会产出思维导图,并且可以利用工具调整思维导图中的内容、样式。

一段录音/视频 变成最后的思维导图,中间的每个节点都是AI赋能,网不卡的情况下,几分钟就可以得到你想要的结果。

结论

如何真正的使用AI,是想办法把AI融进每一个节点,每一个项目,每一个生活场景...