慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

推广

無文章

[宣]Google I/O所布之Gemini Omni Flash,论对话式视频编辑之体验
WickedZX · 2026-05-24 · via 推广

近试 Google 于 I/O 二十六所布之 Gemini Omni Flash,聊其感怀。

此模最大异者,可藉言谈以修视频。既生一节,直呼"易景为海滨"、"缓其速"、"右添一人",则惟改所言之部,余皆如故。不复似 Sora,每必重生全节。

其要者数端:

- 支多态输入:文图音影可并纳之
- 输十秒节,附同音
- YouTube Shorts 免费用,Gemini 应用需 AI Plus ($7.99/月)
- 开发者 API 尚未开,云"数周内"
- 输出皆强加 SynthID 水印

较之 Sora 2,Sora 角色之统一更佳,能成 25 秒之段;Omni Flash 则长于多态输入与对话之编,迭代之费减损甚巨。

然其限亦多:10 秒为极,不能改语音(防 deepfake),文字之绘不甚精,复杂数之景时偶有崩坏。

欲速成视频,可察 [gemini omni]( https://www.veol.ai?utm_source=v2ex),其支最高 4K 出,计费从 $0.15 起始。

有曾用 V 者乎?觉对话式编辑此道甚当,然 10 秒之限实稍促。