












최근 Google의 I/O 2026에서 발표한 Gemini Omni Flash를 사용해보았는데, 느낀 점을 말씀드리겠습니다.
이 모델의 가장 큰 특징은 대화를 통해 영상을 편집할 수 있다는 점입니다. 클립을 생성한 후, "배경을 해변으로 바꾸세요", "카메라를 느리게", "오른쪽에 사람을 추가하세요"라고 말하면, 다른 부분은 유지한 채 해당 부분만 수정해줍니다. Sora처럼 매번 전체 클립을 다시 생성할 필요가 없습니다.
주요 특징 몇 가지:
- 다중 모달 입력 지원: 텍스트+이미지+오디오+비디오를 함께 입력 가능
- 10초 클립 출력, 동기화된 오디오 포함
- YouTube Shorts 무료 사용, Gemini 앱은 AI Plus ($7.99/월) 필요
- 개발자 API는 아직 열리지 않았으며, "몇 주 안에" 열릴 예정
- 모든 출력은 SynthID 워터마크 강제 적용
와 Sora 2와 비교하면:Sora는 캐릭터 일관성이 더 좋고 25초의 클립을 생성할 수 있습니다;Omni Flash는 다중 모달 입력과 대화 편집에서 강점을 가지고 있으며, 반복 비용이 훨씬 적습니다。
는 제한도 많습니다: 10초 제한, 음성 편집 불가(Deepfake 방지), 텍스트 렌더링이 비교적 정확하지 않고, 복잡한 움직임 시나리오에서 가끔씩 오류가 발생합니다。
빠르게 영상 생성을 경험하고 싶다면 [gemini omni]( https://www.veol.ai?utm_source=v2ex)를 참고해 보세요. 최대 4K 출력을 지원하며, 요금은 $0.15부터 시작합니다。
V 사용자가 있다고요? 대화식 편집 방향이 꽤 올바른 것 같지만, 10초 제한은 좀 짧게 느껴집니다。
이 콘텐츠는 인셔셔RSS(RSS 리더)가 자동으로 집계한 것으로 읽기 참고용입니다. 원문 출처 — 저작권은 원저작자에게 있습니다.