惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Hackread – Cybersecurity News, Data Breaches, AI and More
S
Schneier on Security
罗磊的独立博客
Recorded Future
Recorded Future
Hacker News - Newest:
Hacker News - Newest: "LLM"
G
Google Developers Blog
博客园_首页
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
T
The Blog of Author Tim Ferriss
Know Your Adversary
Know Your Adversary
L
Lohrmann on Cybersecurity
C
Cybersecurity and Infrastructure Security Agency CISA
博客园 - 三生石上(FineUI控件)
M
MIT News - Artificial intelligence
B
Blog
T
Tor Project blog
D
Docker
Engineering at Meta
Engineering at Meta
Apple Machine Learning Research
Apple Machine Learning Research
Spread Privacy
Spread Privacy
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Scott Helme
Scott Helme
MyScale Blog
MyScale Blog
量子位
T
The Exploit Database - CXSecurity.com
小众软件
小众软件
aimingoo的专栏
aimingoo的专栏
IT之家
IT之家
AWS News Blog
AWS News Blog
Google Online Security Blog
Google Online Security Blog
NISL@THU
NISL@THU
D
DataBreaches.Net
Help Net Security
Help Net Security
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Cloudbric
Cloudbric
美团技术团队
W
WeLiveSecurity
H
Hacker News: Front Page
宝玉的分享
宝玉的分享
The Cloudflare Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
爱范儿
爱范儿
N
News and Events Feed by Topic
V
Visual Studio Blog
C
CERT Recently Published Vulnerability Notes
T
Tailwind CSS Blog
MongoDB | Blog
MongoDB | Blog
F
Fortinet All Blogs
B
Blog RSS Feed
S
Security Affairs

少数派

派早报:Google 发布 Fitbit Air 等 - 少数派 「新人报到」確認需求,再開始 - 少数派 从 SOLO 独立开发者社区,我看到了越来越多开发者开始做自己的产品 - 少数派 我怎么管理那些"不常做,但总会忘"的生活事项 - 少数派 人形机器人量产元年,数据才是具身智能的“生死线” - 少数派 BuhoLaunchpad 高度还原 Mac 启动台:开发历程与思考 - 少数派 五年陪伴依然不舍,DIY 换壳后让罗技 MX Master 3 继续服役 - 少数派 新玩意 240|少数派的编辑们最近买了啥? - 少数派 一日一技|为什么你应该关闭 iOS 的键盘声音 - 少数派 我做了个插件和 Skills,一键提取任何网站的设计规范 Design.md - 少数派 住在三四线城市的你,该开始录播客了 - 少数派 甘南秘境,大白高国 - 少数派 AI的审美:谁让把我变成川内倫子 - 少数派 返工怎能不烦恼,打工人片单总有一部是你的「嘴替」 - 少数派 为了让「上厕所」更健康,我做了一个小工具 - 少数派 AI + Skill,能够让生成的文章去除 AI 味吗? - 少数派 新玩意|韶音OpenDots ONE 耳夹式耳机 - 少数派 《美满》| 在每一个春天的晚上相爱(362) - 少数派 新玩意|优篮子 PS01 MagSnap 磁吸支架 - 少数派 自我整合手记 | 我开始早睡了:用稳定规则,为自由托底 - 少数派 用龙虾(OpenClaw)两个多月,我最深的12个体会 - 少数派 听歌时间到,12 张你可能错过的 2025 华语乐坛好专辑 - 少数派 承诺能追吗 - 少数派 macOS 26启动台没了? 我做了个不一样的App启动器 - Keboard - 少数派 《四海为家的人》| INTJ对话INTJ(361) - 少数派 你发过的那些黑历史,是时候一次清干净了 - 少数派 新玩意:安安静静玩,越玩越专注:计客密码机 - 少数派 iPad 用户首次体验 Android 平板:vivo Pad6 Pro - 少数派 数据逻辑强 - 少数派 极北行+ | 一路向北,探访日本至北之地 | 001 - 少数派 万字剖析:千问App深度体验报告(2026) - 少数派 在2026年,如何真正防止别人抄袭你的作品 - 少数派 怎么用 50 块搭个 AI 语音助手?我踩了 3 天坑 - 少数派 YeeroAI:让 AI 对话真正成为知识管理的一部分 - 少数派 爬泰山 - 少数派 「旅图显影」 App 更新:这次,我们补上了一点「手感」 - 少数派 假期出门太折磨?我的 23 条经验帮你规划惬意旅行 - 少数派 工作流会变吗 - 少数派 Claude Opus 4.6 怎么用最省钱?我测了 5 种方案 - 少数派 GPT Image 2 让图文并茂不再稀罕 - 少数派 用户侧出发——什么是AI,我要不要学习? - 少数派 找片、转存、整理、播放一条龙!让你的付费网盘值回票价 - 少数派 欢迎试用!日课一问2.0插件 - 少数派 自己做的MDeditor,原本想购买 Typora 试了两次支付不成功,干脆自己做一个 - 少数派 vibe coding了一个 3MB 的小工具,让 ~/Downloads 彻底告别混乱 - 少数派 因为受不了 Mac 的风扇策略,我做了一个风扇控制工具 - 少数派 别只怪模型 - 少数派 Warp 终端的 AI 功能怎么用?我测了一周的体验 - 少数派 AI 写代码老是出 bug?这 5 个配置我后悔没早知道 - 少数派 「新玩意」苹果出相机可能就这样:Sigma BF + 45mm F2.8 DG Contemporary - 少数派 一个面向2030年的AI操作系统是什么样子的:浅谈cola这款有灵魂的Agent - 少数派 别只看写代码 - 少数派 每天解决10个问题,还是一口气攻坚解决400个? - 少数派 AI 交易机器人怎么搭?我用 Claude 跑了一周实盘 - 少数派 Maptoposter Online:把你爱的城市画成艺术海报 - 少数派 Function Calling 怎么用?我测了 3 个模型发现差距真大 - 少数派 Legend Talk:我做了个 AI 圆桌,让 160 位思想家围着你的问题转 - 少数派 如何找到自己的蓝方?在小县城寻找压力测试 - 少数派 语音输入与软件接口|2026年聊AI时,我们都聊些什么(上) - 少数派 混动已经卖爆,纯电又来补刀——钛7闪充版简直“不讲武德” - 少数派 本月玩什么|朋友收藏、识质存在、沙罗周期 - 少数派 为什么要每天坚持输出? - 少数派 Claude API 挂了好几个小时,你的项目有备用方案吗? - 少数派 Function Calling 没你想的复杂——我用它做了个有点用的工具 - 少数派 登录系统立即播放视频或者图片音乐的软件 - 少数派 我为什么创建 FlipHTML5 下载工具 - 少数派 残局没电?多品牌外设电量统一管理软件EasyBluetooth已支持RTSS游戏内显示以及AIDA64 - 少数派 前往通义路的路 - 少数派 太好看了,媲美Sun的个人导航页,NAS部署星云门户 - 少数派 乌黑嘴唇“一键检测”上线了 - 少数派 派早报:Claude AI 接入多个创意软件生态、FILCO 生产方接手品牌等 - 少数派 【更新】BearCLI、Claude 连接器与 MCP 服务器 - 少数派 记了上千条流水,还是看不懂财务?我做了一个让 AI 读懂账本的工作台 - 少数派 MINI R56 升级原厂 Sport 模式 - 少数派 新玩意 | 一棵柠檬树(仿真版) - 少数派 Momenta的“物理AI”野望,需迈过“含摩量”这道关 - 少数派 网页直接投屏控制手机!NAS一键部署PandaScrcpy,流畅丝滑可远程。 - 少数派 众测|邀你一同探索随身 AI 硬件入口 YoooClaw C·ONE - 少数派 2050大会:分享时间是真诚 参会记 - 少数派 iPad 赋能电影创作:国内首部宣纸手绘长片《燃比娃》的幕后故事 - 少数派 AI的审美:我用 8 个大模型给 100 张旅行照片打分 - 少数派 普通人如何破圈?去参加一个本地协会 - 少数派 把极空间的图标全换了,主题DIY全攻略打造你的专属NAS桌面 - 少数派 电子便签墙,帮你实现便签自由 - 少数派 我如何用三个 CLI 工具取代文档创建需求 - 少数派 原来真的有人可以玩一辈子 - 少数派 社区速递 139 | 派友热议三月买了啥、复古单反尼康 Df 体验 - 少数派 06 作品的赏析与评价 - 少数派 TDS REVIEW|索尼 WF-1000XM6 降噪真无线耳机体验 - 少数派 35.98万起售的第二代腾势D9,我看重的不是堆料,而是不凑合 - 少数派 鼠须管 Squirrel 皮肤配置指北 - 少数派 从watch ultra2换到redmi watch6 - 少数派 派早报:阿里巴巴发布视频生成模型 HappyHorse 1.0 等 - 少数派 别迷信1M - 少数派 家人们天塌了!网盘“大封杀”,多个渠道多条路,NAS部署PanHub - 少数派 AI与人勾心斗角!NAS一键部署AI狼人杀,假日休闲必备。 - 少数派 电商必备!Comfyui工作流批量生图插件,一次生成12张!支持Nano banana pro模型 - 少数派 Comfyui工作流配置Gpt-image-2模型教程,0.03/张 - 少数派 OpenClaw第三方APi怎么配置?可使用Gpt-image-2模型 - 少数派 会员社区话题精选 Ep. 103 - 少数派
实测字节豆包1.8,我用Trae和MCP搓出了实时装修Agent - 少数派
2025-12-22 · via 少数派

除了日更图文,

最近我拍的短视频清晰度已经卷到99%了,灯光,拍摄设备,后期流程,能优化的几乎都到头了。

但我想玩点不同的,我背后的空间本身是不是也能成为创作的一部分,用Agent来为我规划每一个角落。我有个很喜欢的科技圈博主@贪玩歌姬小宁子,她每次aroll拍摄每一次都会重新布景,

图片

好玩,想学,我的思路是这样子的,

我没那么大的团队和空间,但我可以用Agent来设计空间里面可替换的物品,组合出不同的搭配,这样我除了ai测评题材,还可以做DIY,科普和数码。

于是,我跟加强过Agent能力的豆包1.8一拍即合,

Image

昨天在火山引擎2025年冬季的原动力大会上已经看到很多离谱的案例了。

wxv_4302362945813839882

长话短说,

这次升级了工具调用,多轮指令遵循和多模态理解能力。1秒1帧的情况下可以理解20分钟的中长视频。

平时测试模型的代码能力已经快腻了,前端,3D建模,写作,物理模拟老四样,感觉在同一套里圈圈圆圆圈圈,

还是做一个能影响物理世界的Agent有挑战性。

Image

一起来头脑风暴一下把大象放进冰箱
 

把一个空间轻装修要分几步,

模型要能读取视频,理解已有的空间关系吧,还需要把不同的场景搭配记录到本地,

最好它还会点CAD图,说不定能帮我找到现在租的这间房子里有没有隐藏的可改造角落,或者分析出有哪些尺寸特殊的家具是需要提前去定制的。

定制的话就要全网比价,这个Agent需要联网,把搜索到的信息整理成文档并自动发送给我。

我花了小两周的时间,在Trae+MCP上实现了这个Agent的完全体。所以让我来一个个模块介绍一下,

读取本地的视频和图片,是我的好朋友@梦飞直接用的豆包多模态能力封装成MCP。

每个MCP的配置教程我都打包好了,还是评论区回复“豆包1.8”就行

Image

原理很简单,就是把视频和图片上传到火山引擎的TOS对象存储,然后就可以通过火山引擎的服务获取到视频解析后的文字版描述。

图片

   上传 # 本地视频 到TOS,然后分析视频的场景结构,告诉我哪些场景适合剪辑成短视频:

Image

豆包给我的回复是,

视频中的照片墙和乐高墙是很有记忆点的品牌资产,建议在我以后录制真人出镜视频时,将其作为固定的背景。

以及我需要一件能够撑起画面专业度的核心家具。一个升降式的实木长桌来取代我的白色异形桌,方便我切换坐姿和站姿,以及拍AI硬件的特写。

因为我觉得文字沟通不够直观,我还给豆包1.8加装了火山引擎版本的jimeng-ai-mcp,让它可以生成效果图,

Image

为了不占地,我还设计了一个没有桌脚的升降桌,重新设计了一下打光系统,

Image

更新装修进度文件我用的是Excel MCP。我一开始用的是Filesystem,但它只能进行简单的读写,而豆包1.8+Excel MCP组合后能理解表格的结构,它知道什么是行,什么是列,能把信息填入对应的单元格。

Image

手搓的过程中,我还找到了目前租的房子的平面图,加上我现场的补充图片(因为会有添置的一些家具),一起丢给豆包1.8,让它给我更多的空间搭配建议。

Image
Image

为了更直观,我用豆包生图重现了一套方案的预览图。

Image

在本地搭Agent有一个隐形的好处,就是你可以像搭乐高一样,自由搭配你需要的联网MCP。

我的经验是国内信息博查,国外信息Exa,组合起来用。

当豆包确定了需要定制的家具列表和尺寸后,我授权它去全网搜索信息,对比不同品牌、材质、价格,把最合适的几个选项,连同购买链接和参数,整理出来。

wxv_4302346176399327244

接了Tripo3D的MCP后,还可以按照尺寸定制一个简单的沙发建模,要是能加上材质配个云朵沙发就更好了。

Image

最后,豆包将这一切汇总,把当天的进度更新、下一步的计划、还有家具的备选清单,自动做成一个多维表格,记录有变化的时候推送给我。

Image

当这个流程第一次完整跑通的时候,

我实打实感觉到这些会消耗我心力的检查、搜索、对比、整理工作,都被它接管了。我只需要专注于整个项目里最核心、最享受的部分,

也就是最初的创意和最终的决策。

这次的体验,让我对AI影响物理世界这件事,有了点想法。它让我从工作室改造计划,回到了我的真实生活,

一个更小,但可能更迫切的需求上。

那就是,我真的很想买个按摩椅啊啊啊。

因为目前房间不大,每次想到要去测量尺寸,上网搜寻各种小型号的按摩椅,再在脑子里模拟把它放在哪个角落不会挡路,这一系列琐碎的步骤一拖再拖。

于是,按摩椅它整个双十一就一直躺在我的购物车里。但现在,我有了新的思路。我完全可以拿起手机,对着我的房间拍一段视频,

然后把视频丢给豆包,直接告诉它,我想在这个房间里放一个按摩椅,帮我规划一下。

它完全有能力通过视频理解我房间的空间布局,分析出可行的摆放位置,再去网上寻找符合空间尺寸的商品,甚至可以告诉我,如果想把它放在窗边,我可能需要把那个书架往左移动五十厘米。

一个让我头疼不已的空间规划问题,

就变成了一个可以执行的方案。

过去半年,我会觉得AI要真正影响和改造物理世界,是需要重依赖物理设备的,比如眼镜、手表,或者各种形态挂件。

但这次构建Agent的过程,

我发现其实不需要等,

其实有台手机就够了,

我的按摩椅可算找到几个完美适配的角落,

Image

朝向都安排好了,

激情下单!

@ 作者 / 卡尔