인셔셔RSS 관심 있는 블로그, 뉴스, 기술 정보를 효율적으로 추적하고 읽으세요
원문 읽기 InertiaRSS에서 열기

추천 피드

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

推广

게시글 없음

[홍보]Google I/O에서 발표한 Gemini Omni Flash, 대화형 비디오 편집 경험 공유
WickedZX · 2026-05-24 · via 推广

최근 Google의 I/O 2026에서 발표한 Gemini Omni Flash를 사용해보았는데, 느낀 점을 말씀드리겠습니다.

이 모델의 가장 큰 특징은 대화를 통해 영상을 편집할 수 있다는 점입니다. 클립을 생성한 후, "배경을 해변으로 바꾸세요", "카메라를 느리게", "오른쪽에 사람을 추가하세요"라고 말하면, 다른 부분은 유지한 채 해당 부분만 수정해줍니다. Sora처럼 매번 전체 클립을 다시 생성할 필요가 없습니다.

주요 특징 몇 가지:

- 다중 모달 입력 지원: 텍스트+이미지+오디오+비디오를 함께 입력 가능
- 10초 클립 출력, 동기화된 오디오 포함
- YouTube Shorts 무료 사용, Gemini 앱은 AI Plus ($7.99/월) 필요
- 개발자 API는 아직 열리지 않았으며, "몇 주 안에" 열릴 예정
- 모든 출력은 SynthID 워터마크 강제 적용

와 Sora 2와 비교하면:Sora는 캐릭터 일관성이 더 좋고 25초의 클립을 생성할 수 있습니다;Omni Flash는 다중 모달 입력과 대화 편집에서 강점을 가지고 있으며, 반복 비용이 훨씬 적습니다。

는 제한도 많습니다: 10초 제한, 음성 편집 불가(Deepfake 방지), 텍스트 렌더링이 비교적 정확하지 않고, 복잡한 움직임 시나리오에서 가끔씩 오류가 발생합니다。

빠르게 영상 생성을 경험하고 싶다면 [gemini omni]( https://www.veol.ai?utm_source=v2ex)를 참고해 보세요. 최대 4K 출력을 지원하며, 요금은 $0.15부터 시작합니다。

V 사용자가 있다고요? 대화식 편집 방향이 꽤 올바른 것 같지만, 10초 제한은 좀 짧게 느껴집니다。