惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

L
LangChain Blog
Security Latest
Security Latest
P
Proofpoint News Feed
GbyAI
GbyAI
PCI Perspectives
PCI Perspectives
博客园 - Franky
N
Netflix TechBlog - Medium
博客园_首页
WordPress大学
WordPress大学
K
Kaspersky official blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Vercel News
Vercel News
T
Threatpost
The Hacker News
The Hacker News
H
Help Net Security
S
Securelist
Recent Announcements
Recent Announcements
腾讯CDC
T
Tailwind CSS Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Engineering at Meta
Engineering at Meta
C
Cisco Blogs
V
V2EX
C
Check Point Blog
S
Schneier on Security
Cyberwarzone
Cyberwarzone
C
Cybersecurity and Infrastructure Security Agency CISA
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
B
Blog RSS Feed
H
Hackread – Cybersecurity News, Data Breaches, AI and More
Jina AI
Jina AI
M
MIT News - Artificial intelligence
T
Threat Research - Cisco Blogs
博客园 - 叶小钗
A
Arctic Wolf
AWS News Blog
AWS News Blog
Latest news
Latest news
Martin Fowler
Martin Fowler
Recorded Future
Recorded Future
Last Week in AI
Last Week in AI
The GitHub Blog
The GitHub Blog
小众软件
小众软件
B
Blog
aimingoo的专栏
aimingoo的专栏
C
Cyber Attacks, Cyber Crime and Cyber Security
V
Visual Studio Blog
P
Palo Alto Networks Blog
Spread Privacy
Spread Privacy

推广

暂无文章

[推广]Google I/O 发布的 Gemini Omni Flash,对话式视频编辑体验分享
WickedZX · 2026-05-24 · via 推广

最近试了下 Google 在 I/O 2026 发布的 Gemini Omni Flash ,说下感受。

这个模型最大的不同是可以通过对话来编辑视频。生成一个片段后,你可以直接说"把背景换成海滩"、"放慢镜头"、"加个人在右边",它会在保留其他内容的基础上只改你说的部分。不用像 Sora 那样每次都重新生成整个片段。

几个关键点:

- 支持多模态输入:文本+图片+音频+视频可以一起喂进去
- 输出 10 秒片段,带同步音频
- YouTube Shorts 免费用,Gemini 应用需要 AI Plus ($7.99/月)
- 开发者 API 还没开放,说是"几周内"
- 所有输出强制带 SynthID 水印

和 Sora 2 比:Sora 角色一致性更好,能生成 25 秒片段; Omni Flash 胜在多模态输入和对话编辑,迭代成本低很多。

限制也不少:10 秒上限、不能编辑语音(防 deepfake )、文字渲染不太准、复杂运动场景偶尔会崩。

如果想快速体验视频生成,可以看看 [gemini omni]( https://www.veol.ai?utm_source=v2ex) ,支持最高 4K 输出,按量计费从 $0.15 起。

有用过的 V 友吗?感觉对话式编辑这个方向挺对的,但 10 秒限制确实有点短。