惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Google DeepMind News
Google DeepMind News
Stack Overflow Blog
Stack Overflow Blog
Hugging Face - Blog
Hugging Face - Blog
博客园_首页
T
The Blog of Author Tim Ferriss
博客园 - 叶小钗
N
Netflix TechBlog - Medium
腾讯CDC
C
Check Point Blog
P
Proofpoint News Feed
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI
S
SegmentFault 最新的问题
F
Fortinet All Blogs
美团技术团队
U
Unit 42
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
博客园 - 司徒正美
F
Full Disclosure
Recorded Future
Recorded Future
D
DataBreaches.Net
博客园 - 【当耐特】
Martin Fowler
Martin Fowler
J
Java Code Geeks
I
InfoQ
Y
Y Combinator Blog
A
About on SuperTechFans
AI
AI
爱范儿
爱范儿
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Forbes - Security
Forbes - Security
W
WeLiveSecurity
M
MIT News - Artificial intelligence
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
Schneier on Security
Schneier on Security
The GitHub Blog
The GitHub Blog
Security Archives - TechRepublic
Security Archives - TechRepublic
aimingoo的专栏
aimingoo的专栏
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
G
GRAHAM CLULEY
Know Your Adversary
Know Your Adversary
Latest news
Latest news
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
D
Docker
Recent Commits to openclaw:main
Recent Commits to openclaw:main
量子位
V2EX - 技术
V2EX - 技术
Project Zero
Project Zero

视频技术

求求支招:视频在线培训网页 电脑播放视频会卡 求助视频 AI 编辑 - V2EX 关于图片生成视频: wan2.2-s2v 模型提示词限制无效问题 [讨论] 大家是如何压缩 MOV 视频的 求一个最完美的 vps 挂载团队盘最优方案,例如 rclone 挂载参数。 - V2EX 关于用电报当作流媒体视频备份库,可以在线播放与分享的方案,以及视频压制的流程 用 google 的 veo 3 生成带声音的 ai 视频大几刀? - V2EX DJI Action 被自动分段的视频如何无痕拼接 有平替 剪映 app 智能扣视频背景 功能吗? 监控视频压缩/抽帧压缩存储优化 有什么视频扣像的软件可以推荐 帧转视频有哪些最快的方案? - V2EX AV1 和 H265 需要多大码率才能达到 90Mbps 的 H264 水平?可以简单换算吗? - V2EX 直播录制视频中连麦/Pk 画面移除 - V2EX 如何比较视频压缩前后的画质? 优酷 Win 客户端不支持臻享 奇怪的 chrome 视频解码问题 - V2EX 阿里云视频播放问题:大视频只播放几秒后,不继续请求分片 想学学视频剪辑之类的技能, 新手使用什么软件比较容易上手? 有什么纯 4K 无广告的播放器 avi 文件修复 - V2EX 开 emby 服的话需要先切片吗? 有做 UP 主的吗?进来看看有没有比这种 AI 去视频水印更好的办法? - V2EX 用更高的码率压制一段视频,他相比原视频多出来码率作用是什么? Emby 播放视频很卡,颜色也不正常,请问是怎么回事? 如何设置视频地理位置元信息? - V2EX 兄弟们, ffmpeg 搞不定, 有懂的大佬吗? 求视频监控解决方案 - V2EX uniapp 方式实现视频播放加密统计 uniapp 方式实现直播带货线上培训 一款可以提取和总结无字幕的 YouTube 的免费工具: NoteGPT! 中台建设方案实现定制化直播平台 如何实现 App 内的视频/直播悬浮小窗播放 - V2EX 打算买个 HDMI 无线投屏器,有没有推荐的?稳定压倒一切 类似于 veed/zeemo 的动态字幕效果怎么实现 - V2EX 分享一个 AI 生成视频的网站 Sora Video AI - V2EX 有没有自动从视频识别精彩瞬间并提取照片的 AI 工具? - V2EX 抖音真恶心能下载到的最高画质也是经过压缩的 - V2EX 有偿, MP4 视频时长与实际不符的问题 都 2024 年了,体育赛事直播还在 25Hz1080 还 i... - V2EX MPC Video Renderer 中 RTX 超分辨率和正确的视频缩小效果只能二选一吗 - V2EX 推荐几个在用的视频下载工具 网上有公开的大华或者海康的视频流做测试码? 已有音频文稿,怎样生成字幕时间线 - V2EX 请问现在最新的表情迁移研究,有开源代码项目的是哪些啊? tx 视频网页版部分已不给看。。。 你们看 HDR 视频觉得效果好吗 - V2EX vlc 播放器播放视频切换时会使当前窗口退出活动状态,这个怎么不使当前窗口退出活动状态呢? - V2EX 关于 AMD 显卡与 Pr 硬件加速相关的问题 我街拍录制视频的时候,右下角有个地图,随时告诉观众我在哪里,这个需求有办法实现吗?
Update 最近折腾 AI 视频生成的一些心得(顺便分享下我做的小工具)
Kelly00 · 2025-11-14 · via 视频技术

最近这段时间因为在研究短视频营销,顺便也去试了不少 AI 视频生成工具,发现一个很有意思的现象: 绝大多数视频模型的“能力”其实不错,但真正能用于商业或者电商场景的,反而非常少。

原因大概有几个: 1.生成时间太长,随便一次就是 2 ~ 5 分钟。 2.只能做 2 ~ 3 秒的单镜头,没办法做故事。 3.有水印不能商用。 4.很多地区直接打不开,要等邀请码。 5.电商相关的“产品手持、展示、生活场景”模型不太稳定。

我和几个做 TikTok Shop 的朋友聊之后,他们最头疼的其实不是“模型效果多好”,而是:有没有 干净、可直接用 的视频?能不能一键生成 20 秒以上?产品能不能在不同镜头里保持一致?有没有简单的“产品展示模板”?结果这类需求反而是现有工具最薄弱的地方。因为好奇,我就尝试自己写了一个 demo ,想看看能不能做出一个至少能用的版本: 1.单镜头 10 秒视频 2.简单的多镜头( 25 秒) storyboard 3.图生视频:把商品图转成一个生活类短片 4.尽量不让人物、产品在不同镜头变来变去

期间踩了很多坑,包括: 1.prompt 拆帧会乱跑 2.镜头切换会抖 3.人物肤色、衣服一致性难控制 4.模板难设计(电商场景比想象中复杂) 5.模型挑 prompt ,很“挑食” 不过折腾下来之后,至少能跑起来了。我把它放在 Saro2.ai 这个域名上,算是一个半实验性质的小工具。不是开源的,需要登录(为了防滥用 + 控制算力),不过已经能用。

分享几个让我觉得“AI 视频比想象中更难”的点

  1. 视频最难的是“稳定”,不是画质 画质现在的模型都不差,但稳定性才决定能不能用来卖货。
  2. 多镜头比单镜头难一个次元 因为镜头之间的“连贯”完全是 pipeline 做出来的,而不是模型懂的。
  3. prompt 工程真的非常玄学 字多了不行,字少了也不行,有时候非常好的效果只是随机种子幸运。
  4. 做商家视频比做创意视频难太多

因为必须要:真实、不跳帧、不变形、产品不能乱改、不能乱加奇怪东西、模型很容易“发挥创造力”,但商家要的是“不要发挥”。我觉得 AI 视频这个方向会越来越“工具化 / 场景化”,真正好用的工具未必是最强模型,而是最懂商业使用场景的。

有在做 TikTok Shop 、Shopify 商品视频、UGC 、AI 生成视频、视频工具插件、欢迎留言交流下经验。

如果想看看我上面说的那个 demo ,这里:Saro2.ai (一个我自己做的小的实验站)