慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

推广

記事がありません

[プロモーション]Google I/Oで発表されたGemini Omni Flash、会話形式のビデオ編集体験の共有
WickedZX · 2026-05-24 · via 推广

最近、Google が I/O 2026 で発表した Gemini Omni Flash を試してみたので、感じたことをお話しします。

このモデルの最大の違いは、会話を通じて動画を編集できることです。クリップを生成した後、「背景をビーチに変えて」「カメラを遅くして」「右側に人を追加して」と直接言うだけで、他の部分を保持したまま指定した部分だけを変更してくれます。Sora のように、毎回全体を再生成する必要はありません。

いくつかのポイント:

- 複数のモード入力をサポート:テキスト+画像+音声+動画を一緒に入力可能
- 10秒のクリップを出力、同期音声付き
- YouTube Shorts は無料利用可能、Gemini アプリは AI Plus ($7.99/月)が必要
- デベロッパー API はまだ公開されておらず、「数週間以内」と言われています
- すべての出力には SynthID 水印が強制されます

とSora 2を比較すると:Soraはキャラクターの統一性が良く、25秒のクリップを生成できます;Omni Flashは多モーダル入力と会話編集に優れ、イテレーションコストが大幅に低いです。

の制限も多く:10秒の上限、音声編集不可(deepfake防止)、テキストレンダリングがあまり正確でない、複雑な動きのシーンで時折クラッシュする。

動画生成を素早く体験したいなら、[gemini omni]( https://www.veol.ai?utm_source=v2ex)を見てみてください。最高4K出力をサポートし、料金は$0.15からです。

V友を経験した人はいますか?会話式編集という方向性は正しいと思うが、10秒の制限は確かに短いです。