












近试 Google 于 I/O 二十六所布之 Gemini Omni Flash,聊其感怀。
此模最大异者,可藉言谈以修视频。既生一节,直呼"易景为海滨"、"缓其速"、"右添一人",则惟改所言之部,余皆如故。不复似 Sora,每必重生全节。
其要者数端:
- 支多态输入:文图音影可并纳之
- 输十秒节,附同音
- YouTube Shorts 免费用,Gemini 应用需 AI Plus ($7.99/月)
- 开发者 API 尚未开,云"数周内"
- 输出皆强加 SynthID 水印
较之 Sora 2,Sora 角色之统一更佳,能成 25 秒之段;Omni Flash 则长于多态输入与对话之编,迭代之费减损甚巨。
然其限亦多:10 秒为极,不能改语音(防 deepfake),文字之绘不甚精,复杂数之景时偶有崩坏。
欲速成视频,可察 [gemini omni]( https://www.veol.ai?utm_source=v2ex),其支最高 4K 出,计费从 $0.15 起始。
有曾用 V 者乎?觉对话式编辑此道甚当,然 10 秒之限实稍促。
此內容由慣性聚合(RSS閱讀器)自動聚合整理,僅供閱讀參考。 原文來自 — 版權歸原作者所有。