












最近、Google が I/O 2026 で発表した Gemini Omni Flash を試してみたので、感じたことをお話しします。
このモデルの最大の違いは、会話を通じて動画を編集できることです。クリップを生成した後、「背景をビーチに変えて」「カメラを遅くして」「右側に人を追加して」と直接言うだけで、他の部分を保持したまま指定した部分だけを変更してくれます。Sora のように、毎回全体を再生成する必要はありません。
いくつかのポイント:
- 複数のモード入力をサポート:テキスト+画像+音声+動画を一緒に入力可能
- 10秒のクリップを出力、同期音声付き
- YouTube Shorts は無料利用可能、Gemini アプリは AI Plus ($7.99/月)が必要
- デベロッパー API はまだ公開されておらず、「数週間以内」と言われています
- すべての出力には SynthID 水印が強制されます
とSora 2を比較すると:Soraはキャラクターの統一性が良く、25秒のクリップを生成できます;Omni Flashは多モーダル入力と会話編集に優れ、イテレーションコストが大幅に低いです。
の制限も多く:10秒の上限、音声編集不可(deepfake防止)、テキストレンダリングがあまり正確でない、複雑な動きのシーンで時折クラッシュする。
動画生成を素早く体験したいなら、[gemini omni]( https://www.veol.ai?utm_source=v2ex)を見てみてください。最高4K出力をサポートし、料金は$0.15からです。
V友を経験した人はいますか?会話式編集という方向性は正しいと思うが、10秒の制限は確かに短いです。
このコンテンツは慣性聚合(RSSリーダー)によって自動集約されています。参考としてご覧ください。 原文出典 — 著作権は原著者に帰属します。