慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

V2EX

家有老人,看电视直播有啥软件 净水器有没有必要按时更换滤芯 Draw io 之类的画图工具是不是非常有必要? cursor 的次数套餐以后应该都用不了新模型了 copilot 更新了 Claude code cli? openrouter 使用国外模型 V 站为什么不能进行回复互动? 买了咸鱼低价 Gemini pro,账号差点被盗。突然发现国内诈骗成本为零 hermes session 会话标题是不能自定义的吗? 爱上合租妹子 5 - 掰指头看甜蜜蜜 感觉职场对新人会越来越不友好 中转站三步曲 看看你的中转站到哪一步了 现在还有人倒腾 NDS/NDSi 和烧录卡吗? 未来会靠 token 活着吗? Gemini 手机版客户端登陆总是在此国家/地区无法使用 gemini APIv2 新增置顶主题接口 ⛽ RootFlow AI — Opus 4.7 重磅上线,限时福利 [加群领 10U 额度 评论留 ID 再发 5U] IOS 版本 Telegram 原生支持中文了? 一个 Hacker News 命令行工具(CLI) 感觉 gpt 这些低价渠道要爆了 hermes-agent 使用场景是什么,真的有人常用吗 token 可以被保存吗? 独立开发|做了个「情簿子」小程序,解决人情往来记账痛点,无广告无套路 claude code 和 codex 在 vibe coding 还有质的区别吗? 买了台新的 air m5,感觉触控板明显不如 m1 顺滑,有办法解决吗? 阿里 Coding Plan 一天三变, Lite 版本到期不能续费了 [抽奖/支付现金红包] 因为收藏夹太乱太杂,所以我花了半年做了一个产品社区:产品派 RAG 难以让人满意啊 2026 年了,这个世界还存在互联网精神🥹 [2026 年 4 月]当前哪一家的 token 输出最快?被 minimax/glm 折磨疯了?现在哪一家反应能稳定一些? Codex 这个申请权限的交互好有意思 两个账号阵亡,尼区 Claude Pro 订阅 租房之旅-感觉这次很幸运 GPT Plus 1 个月, 18 元包质保 分享下最近低价 GPT Codex 的来源(源头) 手搓宝宝监护器 OpenAI 发布 Codex 重大更新:支持自动操作电脑与长期任务自动化 移动下场了。免费送一个月 coding Plan(3w 次调用) 试着把个人博客转成小程序,结果腾讯审核不让过,说有信息资讯? 我把 Claude Opus 4.7 的 HN+V2EX 吐槽贴扒了一遍,发现了一些有意思的东西 使用 claude 从 0 开始开发一个校友会系统可行吗 做了个 iOS 成语填字 APP,送 50 个终身会员 [送码]多角色沉浸式听书 app, 送 20 个订阅,注册留邮箱即可 typeC 转 USB 的转换头有质量差异吗 继续启动!全程质保的 gpt plus!中年程序员副业的第四天 同一个 appleid 可以给不同 chatGPT 账号订阅 plus 吗? 自动驾驶项目开发建议 AI 大模型明星项目|诚聘 Data Engineer & Web Scraping Engineer(新加坡|可办签证 | 代发) setapp 这是啥意思,放进来还要收钱? 终于, 降智几天之后, opus4.7 出来了
[推廣]Google I/O 發佈的 Gemini Omni Flash,對話式視頻編輯體驗分享
WickedZX · 2026-05-24 · via V2EX

最近試了下 Google 在 I/O 2026 發佈的 Gemini Omni Flash ,說下感受。

這個模型最大的不同是可以通過對話來編輯視頻。生成一個片段後,你可以直接說"把背景換成海灘"、"放慢鏡頭"、"加個人在右邊",它會在保留其他內容的基礎上只改你說的部分。不用像 Sora 那樣每次都重新生成整個片段。

幾個關鍵點:

- 支持多模態輸入:文本+圖片+音頻+視頻可以一起喂進去
- 輸出 10 秒片段,帶同步音頻
- YouTube Shorts 免費用,Gemini 應用需要 AI Plus ($7.99/月)
- 開發者 API 還沒開放,說是"幾周內"
- 所有輸出強制帶 SynthID 水印

和 Sora 2 比:Sora 角色一致性更好,能生成 25 秒片段; Omni Flash 勝在多模態輸入和對話編輯,迭代成本低很多。

限制也不少:10 秒上限、不能編輯語音(防 deepfake )、文字渲染不太準、複雜運動場景偶爾會崩。

如果想快速體驗視頻生成,可以看看 [gemini omni]( https://www.veol.ai?utm_source=v2ex) ,支持最高 4K 輸出,按量計費從 $0.15 起。

有用過的 V 友嗎?感覺對話式編輯這個方向挺對的,但 10 秒限制確實有點短。