惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

GbyAI
GbyAI
T
The Exploit Database - CXSecurity.com
酷 壳 – CoolShell
酷 壳 – CoolShell
罗磊的独立博客
T
The Blog of Author Tim Ferriss
The Register - Security
The Register - Security
aimingoo的专栏
aimingoo的专栏
MyScale Blog
MyScale Blog
Martin Fowler
Martin Fowler
Y
Y Combinator Blog
V
V2EX
Microsoft Security Blog
Microsoft Security Blog
H
Help Net Security
Jina AI
Jina AI
M
MIT News - Artificial intelligence
Stack Overflow Blog
Stack Overflow Blog
P
Proofpoint News Feed
美团技术团队
Last Week in AI
Last Week in AI
U
Unit 42
Security Latest
Security Latest
Cloudbric
Cloudbric
Recent Announcements
Recent Announcements
月光博客
月光博客
T
Tailwind CSS Blog
V
Visual Studio Blog
SecWiki News
SecWiki News
The Cloudflare Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Cisco Talos Blog
Cisco Talos Blog
The Last Watchdog
The Last Watchdog
C
Cyber Attacks, Cyber Crime and Cyber Security
D
DataBreaches.Net
Vercel News
Vercel News
W
WeLiveSecurity
P
Palo Alto Networks Blog
C
CERT Recently Published Vulnerability Notes
博客园 - 聂微东
宝玉的分享
宝玉的分享
Google Online Security Blog
Google Online Security Blog
D
Docker
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
N
News | PayPal Newsroom
爱范儿
爱范儿
T
Tor Project blog
博客园_首页
S
Security @ Cisco Blogs
Google DeepMind News
Google DeepMind News
I
InfoQ
S
Schneier on Security

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
普通人创作千万播放量爆款视频不是梦!从字节走出的产品人,做了一款AIGC视频神器
华卫 · 2026-06-16 · via InfoQ - 促进软件开发领域知识与创新的传播

作者 | 华卫

2026 年的 AI 视频行业,几乎可以用“爆炸”来形容。Seedance 的发布让生成能力再次跃迁,漫剧成为流量黑马,AI 视频 Agent 一夜之间涌现出 50 多家。甚至有人断言,影视行业正在被“直接干趴”。

但如果把视角从模型榜单切回真实用户,会发现另一幅画面:新手依然不会做视频、专业用户依然很累、提示词越来越复杂、实操成本越来越高。应用端的现状是,模型的能力被卷得更强了,却很少有人关心:这些能力,普通人到底用不用得起来。

OiiOii 2.0 的出现,恰好踩在这个点上。从去年年底内测时引爆 10 万人排队的现象级事件,到近日 2.0 版本全面升级,它没有沉迷于大模型参数的军备竞赛,而是走了一条截然相反的路:把模型能力真正封装成普通人指尖的创作乐趣。

据悉,现在已经有很多 UP 主,通过 OiiOii 创作出了系列爆款作品。UP 主“谷之漫”在 B 站发的 6 条视频,播放量累计达到 2100 万+;漫剧段子类账号,用 OiiOii 结合热点事件产出短片,成功产出 80w 爆款作品;短漫剧类账号,用 OiiOii 制作后短期内产出多条万赞爆款作品;还有 OiiOii 孵化的创作者的原创 IP,账号至今已过万粉。OiiOii 助推的原创 ip,作品已登上学习强国以及央视网,产出多个万赞爆款故事短片。

“过去制作一条 AI 短片至少要耗时一周以上,如今借助 OiiOii,8 分钟的成片仅需 1-2 天即可高效完成。”头部 AI 创作者“小红爪”表示,在使用 OiiOii 后,发现 AI 视频生产效率原来还能再提高这么多。 1 个人、2 天半,就用 OiiOii 制作出了效果媲美游戏动画的二创剧情微电影。效率的飞跃,是小红爪力荐 OiiOii 的核心理由。

近日,AI 创作工具 OiiOii 官宣升级 2.0 版本,重磅发布智能画布、拉片复刻、Skill 库三大核心新能力,直击 AI 视频创作门槛高、学习成本高、抽卡率高等行业痛点,并覆盖动画、游戏宣发、短漫剧等核心场景。

一张智能画布,7 个 AI Agent 为你“打工”

AI 视频创作最大的隐形门槛,不是模型,而是流程。角色设计、分镜拆解、镜头调度、音乐匹配、风格统一……这些环节过去依赖的是专业分工,如今则变成了用户要亲自操控的“多模型协作”。

OiiOii 2.0 这次的一大核心升级名为智能画布,正是对这些痛点的精准解决。它不再是传统意义上的编辑界面,而就像是一个拥有自我意识的创作宇宙。在无限大的画布上,用户不再需要面对冰冷的参数和复杂的提示词栏,可以拖入一张草图、一段随手拍的视频,甚至只是一个模糊的想法,然后像指挥一个剧组一样,与画布上随时待命的 7 位 AI Agent 员工“聊天”,包括角色总监、分镜总监、音乐总监……

“帮我让这个角色更可爱一点。”“分镜 1 的节奏太慢了,紧凑些。”“把整个场景换成爱死机-吉巴罗的风格。”用户只管说出需求,Agent 们会自动理解画布上的上下文,写提示词、调参数、控效果。正如闹闹所追求的核心理念:“减少‘背提示词’‘抽卡’这类枯燥的工作量,更多帮助用户释放创造力。”在这里,AI 不再是需要被多次调教的工具,而是一位懂你的合作伙伴。

更关键的突破在于,智能画布真正实现了“无限并发”。针对用户使用 Agent 时最痛苦的“等待响应”问题,OiiOii 团队做出了一个“困难但正确”的决定:制定了在同一个画布上并发启动多个 agent 的技术方案,用户可以在画布任何位置,针对画布元素进行 agent 对话,对话之间上下文完全独立。

也就是说,7 个 Agent 可以在画布上同时独立工作。比如用户可以在等待角色图精修的同时,去调整另一段分镜的配乐。

这背后的困难不少:如何确保多个 agent 操作同一份画布数据不冲突?如何保证每个 agent 执行的稳定性?如何减轻用户在多个 agent 之间切换的心智负担?

为了实现这个目标,该团队做了几件事:

  • 修改底层架构,该团队讨论无数次。经常讨论到凌晨,决定做困难但正确的事。每一天重新打开代码库都几乎是全新的,每日的发版总结都长得像高考作文。

  • 动底层架构是最难受的,为了让新功能适配兼容老数据做了无数尝试

  • 为了让调整更清晰明确,深入了解用户需求,工程师开始承担一部分售后工作,接听用户电话反馈,和用户实时沟通,从一线体会用户需要。遇到过客户指着两张在团队成员眼中一模一样的图片说:人物完全变了。他们只能跟用户反复沟通不相似的点,反复测试 faceid 的参数,最终达成一致的效果。

拉片复刻+Skill 库:让新手秒变“导演”

如果说智能画布解决了“怎么做”的效率问题,那么 “拉片复刻” 与 “Skill 库” 则从根本上降低了“做什么”和“做得好”的门槛。

OiiOii 的“拉片复刻”功能,简直是创作者“上帝视角的外挂”。用户只需上传任何一段心仪的视频,OiiOii 会自动从音乐、音效、剪辑、分镜、镜头叙事等最多 18 个专业维度进行拆解,将一部“黑箱”般的作品,还原成一张清晰、可学习的创作蓝图。更妙的是,一键“复刻”功能,允许替换其中的主体(角色、场景、道具),瞬间生成属于用户自己的同款风格视频。

这意味着,对一个想踏入自媒体行业的小白来说,OiiOii 就是一所“随身携带的电影学院”。用户可以通过拉片学习顶尖作品的叙事节奏、运镜技巧,然后立刻将它们转化为生产力。而对于专业作者,它则是处理“追热点”“批量生成”等重复性“脏活累活”的一款不错提效工具。

目前,OiiOii 还上线了 150+风格库,不仅有经典的动画和游戏画风,还有契合热点快速上线的风格库能力,比如最近爆火的“爱死机”风格,选择“爱死机-吉巴罗”风格就能自己制作出一条极具吉巴罗手绘风格特点的大片。

OiiOii 的“Skill 库”则更进一步,将 AI 能力从“通用”带向了“行业专精”。针对自媒体故事短片、短漫剧、游戏宣发、动画等垂直领域,OiiOii 预置了深度定制的 Skill 工具包,各行业素材直出。

以竞争激烈的短漫剧为例,“角色一致性”几乎是行业内所有制作方的噩梦。好的短漫剧作品里,角色更加像是被主创团队倾注感情有血有肉的人物投影。创作者希望实现人物脸部的绝对一致性,从脸型到发饰、从眼角到瞳色都希望和角色图完全一致。但彼时,业界其实还没有真正高完成度的解决方案。

为了解决这个问题,OiiOii 团队先在产品中加入了角色脸部的特写,并将它作为 Agent 链路的“首要角色”。经过上百次的内部测试后,这个能力才正式上线。后续,用户体验确实有所升级。但另一个问题随之浮现:分镜视频中角色的呈现不仅受到角色图影响,场景、视频风格也会间接的影响角色面部表现。例如一个真实的用户 case:“角色在昏暗的地牢中,脸部也会变得脏兮兮的,这不是我所期望的”。

随后团队开启了第二轮开发:模型微调。团队精确的调整了场景垫图、风格提示词对角色的影响,维护了一份独立的脸部数据,并允许用户替换角色头像。角色头像(face id)将会在生成分镜视频的时候独立注入作为脸部一致性的重要参考。

“用自动化的故事链路跑短剧生成,用起来真的很爽,而且 OiiOii 的角色一致性做的好,也大大减少抽卡的损耗“。持续针对短漫剧用户的调研和优化,也让 OiiOii 团队收获了很多创作者的好评。

从“剪映”出走的创始人:不搞高大上功能

探究 OiiOii 这一切产品理念的源头,不得不提其创始人闹闹。其职业生涯,几乎贯穿了中国互联网内容创作工具的三个时代:微信早期产品经理出身;在字节负责剪映以及抖音/Tiktok 的特效业务;B 站大动画业务负责人。

如今,闹闹将在“剪映”验证过的产品方法论,完整地带到了 AI 视频领域。此前,字节被戏称为真正的产品黄埔军校,尤其是剪映部门。剪映历任产品/技术高管先后出走创业,在 AI 领域占据重要位置;剪映产品负责人张琪智悄然离职创业,剪映商业化负责人陈冕离职创办 LiblibAI,一年拿下 9 亿融资。另外,飞书和 AI Lab 也走出不少拿到顶级 VC 的创业者。

“在 AI 视频工具领域,我们不做‘Pr’,而是做‘剪映’,不搞高大上看起来专业的功能,只解决用户想要更“好用”的问题。当普通人也能简单上手使用 AI 工具时,其实专业用户也会喜闻乐见。” OiiOii 创始人闹闹经常对团队表示,用户不需要懂技术名词,好用、能出片最重要。产品做的简单直白,不去制造 AI 焦虑,让每个人都会用,简单地享受创作内容的乐趣。

OiiOii 现在给出的一个个鲜活案例也证明了,AI 视频创作的权利,正在流向每一个有表达欲的普通人。

这种“为普通人设计”的思维,决定了 OiiOii 所有的技术探索,都必须服务于“好用”这一最终目的。无论是让 AI 去调教 AI 的智能画布,还是将专业电影知识封装成傻瓜式操作的拉片复刻,背后都是这套产品策略的胜利。而对专业用户来说,他们终于可以从基础工作中解脱出来,专注于更高层次的创意表达。

今年初,闹闹在一场播客采访中用一个精妙的比喻来解释 Agent 和模型厂商的关系,“大模型就像大型超市,而 Agent 是川菜馆、粤菜馆。你可以去超市买菜自己做,但餐馆永远有存在的价值。”这套“超市与餐馆”理论,不仅解释了 OiiOii 的定位,也表达了她的信心:即使 Sora 到了 4.0/5.0,Agent 产品也不会消亡,反而会更加繁荣。