인셔셔RSS 관심 있는 블로그, 뉴스, 기술 정보를 효율적으로 추적하고 읽으세요
원문 읽기 InertiaRSS에서 열기

추천 피드

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

V2EX

家有老人,看电视直播有啥软件 净水器有没有必要按时更换滤芯 Draw io 之类的画图工具是不是非常有必要? cursor 的次数套餐以后应该都用不了新模型了 copilot 更新了 Claude code cli? openrouter 使用国外模型 V 站为什么不能进行回复互动? 买了咸鱼低价 Gemini pro,账号差点被盗。突然发现国内诈骗成本为零 hermes session 会话标题是不能自定义的吗? 爱上合租妹子 5 - 掰指头看甜蜜蜜 感觉职场对新人会越来越不友好 中转站三步曲 看看你的中转站到哪一步了 现在还有人倒腾 NDS/NDSi 和烧录卡吗? 未来会靠 token 活着吗? Gemini 手机版客户端登陆总是在此国家/地区无法使用 gemini APIv2 新增置顶主题接口 ⛽ RootFlow AI — Opus 4.7 重磅上线,限时福利 [加群领 10U 额度 评论留 ID 再发 5U] IOS 版本 Telegram 原生支持中文了? 一个 Hacker News 命令行工具(CLI) 感觉 gpt 这些低价渠道要爆了 hermes-agent 使用场景是什么,真的有人常用吗 token 可以被保存吗? 独立开发|做了个「情簿子」小程序,解决人情往来记账痛点,无广告无套路 claude code 和 codex 在 vibe coding 还有质的区别吗? 买了台新的 air m5,感觉触控板明显不如 m1 顺滑,有办法解决吗? 阿里 Coding Plan 一天三变, Lite 版本到期不能续费了 [抽奖/支付现金红包] 因为收藏夹太乱太杂,所以我花了半年做了一个产品社区:产品派 RAG 难以让人满意啊 2026 年了,这个世界还存在互联网精神🥹 [2026 年 4 月]当前哪一家的 token 输出最快?被 minimax/glm 折磨疯了?现在哪一家反应能稳定一些? Codex 这个申请权限的交互好有意思 两个账号阵亡,尼区 Claude Pro 订阅 租房之旅-感觉这次很幸运 GPT Plus 1 个月, 18 元包质保 分享下最近低价 GPT Codex 的来源(源头) 手搓宝宝监护器 OpenAI 发布 Codex 重大更新:支持自动操作电脑与长期任务自动化 移动下场了。免费送一个月 coding Plan(3w 次调用) 试着把个人博客转成小程序,结果腾讯审核不让过,说有信息资讯? 我把 Claude Opus 4.7 的 HN+V2EX 吐槽贴扒了一遍,发现了一些有意思的东西 使用 claude 从 0 开始开发一个校友会系统可行吗 做了个 iOS 成语填字 APP,送 50 个终身会员 [送码]多角色沉浸式听书 app, 送 20 个订阅,注册留邮箱即可 typeC 转 USB 的转换头有质量差异吗 继续启动!全程质保的 gpt plus!中年程序员副业的第四天 同一个 appleid 可以给不同 chatGPT 账号订阅 plus 吗? 自动驾驶项目开发建议 AI 大模型明星项目|诚聘 Data Engineer & Web Scraping Engineer(新加坡|可办签证 | 代发) setapp 这是啥意思,放进来还要收钱? 终于, 降智几天之后, opus4.7 出来了
[홍보]Google I/O에서 발표한 Gemini Omni Flash, 대화형 비디오 편집 경험 공유
WickedZX · 2026-05-24 · via V2EX

최근 Google의 I/O 2026에서 발표한 Gemini Omni Flash를 사용해보았는데, 느낀 점을 말씀드리겠습니다.

이 모델의 가장 큰 특징은 대화를 통해 영상을 편집할 수 있다는 점입니다. 클립을 생성한 후, "배경을 해변으로 바꾸세요", "카메라를 느리게", "오른쪽에 사람을 추가하세요"라고 말하면, 다른 부분은 유지한 채 해당 부분만 수정해줍니다. Sora처럼 매번 전체 클립을 다시 생성할 필요가 없습니다.

주요 특징 몇 가지:

- 다중 모달 입력 지원: 텍스트+이미지+오디오+비디오를 함께 입력 가능
- 10초 클립 출력, 동기화된 오디오 포함
- YouTube Shorts 무료 사용, Gemini 앱은 AI Plus ($7.99/월) 필요
- 개발자 API는 아직 열리지 않았으며, "몇 주 안에" 열릴 예정
- 모든 출력은 SynthID 워터마크 강제 적용

와 Sora 2와 비교하면:Sora는 캐릭터 일관성이 더 좋고 25초의 클립을 생성할 수 있습니다;Omni Flash는 다중 모달 입력과 대화 편집에서 강점을 가지고 있으며, 반복 비용이 훨씬 적습니다。

는 제한도 많습니다: 10초 제한, 음성 편집 불가(Deepfake 방지), 텍스트 렌더링이 비교적 정확하지 않고, 복잡한 움직임 시나리오에서 가끔씩 오류가 발생합니다。

빠르게 영상 생성을 경험하고 싶다면 [gemini omni]( https://www.veol.ai?utm_source=v2ex)를 참고해 보세요. 최대 4K 출력을 지원하며, 요금은 $0.15부터 시작합니다。

V 사용자가 있다고요? 대화식 편집 방향이 꽤 올바른 것 같지만, 10초 제한은 좀 짧게 느껴집니다。