惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

爱范儿
爱范儿
博客园_首页
W
WeLiveSecurity
S
Secure Thoughts
S
Security @ Cisco Blogs
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Hugging Face - Blog
Hugging Face - Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
H
Hacker News: Front Page
Project Zero
Project Zero
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
U
Unit 42
N
News and Events Feed by Topic
N
News and Events Feed by Topic
Hacker News - Newest:
Hacker News - Newest: "LLM"
Forbes - Security
Forbes - Security
T
Tor Project blog
I
Intezer
B
Blog
F
Full Disclosure
Security Archives - TechRepublic
Security Archives - TechRepublic
F
Fortinet All Blogs
Schneier on Security
Schneier on Security
T
Threat Research - Cisco Blogs
AI
AI
Google DeepMind News
Google DeepMind News
L
LINUX DO - 最新话题
Cloudbric
Cloudbric
L
Lohrmann on Cybersecurity
WordPress大学
WordPress大学
博客园 - 聂微东
雷峰网
雷峰网
P
Privacy International News Feed
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
PCI Perspectives
PCI Perspectives
Y
Y Combinator Blog
Spread Privacy
Spread Privacy
Simon Willison's Weblog
Simon Willison's Weblog
罗磊的独立博客
Vercel News
Vercel News
A
Arctic Wolf
The Register - Security
The Register - Security
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Microsoft Azure Blog
Microsoft Azure Blog
H
Heimdal Security Blog
Know Your Adversary
Know Your Adversary
P
Proofpoint News Feed
C
Cybersecurity and Infrastructure Security Agency CISA
P
Proofpoint News Feed

博客园 - 蓝星空

测试使用 MiniMax Agent 生成教师个人介绍网页 用 AI 搞定老照片修复工作:基于 Image 2 的图生图(编辑)实战与提示词 Prompt 调优 MD-To.com 已加入 Stripe Climate 计划 如何使用 AI 生成小红书九宫格图片并自动裁切(自媒体高效搞流教程) Markdown 转换工具网站 MD-To.com 德语版上线了 怎么打开后缀名为 .md 的 Markdown 文件?(推荐一个超好用的在线工具) 写了个 GPTs: Markdown to PDF Guide md-to.com 在 SaaSHub 终于通过审核并成功上线了 现在还有多少用户会使用在线收藏工具? Markdown 表格转 PDF 工具已上线,轻松解决 Markdown 表格导出难题 MD-To.com 入选“小红书和 VibeFriends 共同选出的优秀 Vibe Coding 作品”啦! Markdown 转换工具浏览器扩展 - Microsoft Edge 插件 MD-To.com 又上线了一个新功能:PDF 转 Markdown 工具,简单、好用、不上传数据 MD-To.com 上线了新功能:Markdown 编辑器(支持富文本直接转 MD,适配公众号排版) 测试一下 lokuma.app 生成网站的效果 商品页面:联想拯救者Y7000P 2025/2026 用 Minimax Agent 来生成网页也挺好玩的 测试看看 Yandex 搜索的搜索结果 打算给我的PDF 去除水印工具网站换个 UI 用 Manus 写了一个 Free Markdown to Confluence Wiki Converter 主题的页面,真漂亮! 已经上线2个月的 md-to.com 在 ProductHunt 网站打榜了 测试一下 Lovable 生成的网页效果 使用智谱 GLM-5 大模型在线生成了几个网站,测试的效果还不错 VS Code 扩展 Markdown 转图片 上线了(2026.2.12 更新了 v0.0.2版) Markdown 转换工具 Edge 浏览器版插件也上线了 我写的 Markdown 转换工具(Chrome 扩展)在 Chrome 应用商店上线了
把「画分镜」当成写代码:用一段结构化提示词让 Image-2 一次生成 9 格脚本
蓝星空 · 2026-06-14 · via 博客园 - 蓝星空

作为程序员,我对「分镜」这种偏美术的活儿一向头大——直到我发现,给图像模型写提示词这件事,本质上和写代码没区别:把需求结构化、约束写清楚、小步迭代,产出就稳定。

这篇就拿一个程序员都能会心一笑的例子(深夜加班的程序员 + 一只会说话的橘猫一起修 bug),讲清楚怎么用 Image-2 一段提示词出一整张带网格、带镜头标注的专业分镜图。不需要任何绘画基础,重点全在提示词的「结构」上。

分镜是什么,为什么值得自动化

拍短片、剪 vlog、做广告 TVC,正式开拍前都得先有分镜:把片子拆成一格一格的画面,标好镜头、动作、转场和音效,团队照着拍。传统做法手绘或在专业软件里一格格摆,门槛高、改一版成本巨大。

而图像模型擅长的恰好是「一次性生成结构化排版的图」。只要提示词写得像一份规格说明(spec),它就能把 9 格画面、景别、说明文字一次性排好。

一、把提示词当成一份 spec 来写

先上能直接用的模板,把故事概念换成你自己的:

根据下面的故事概念,生成一张 16:9 的分镜图(storyboard),按 3 列 x 3 行共 9 格排列:

故事概念:一个深夜加班的程序员,遇到一只会说话的橘猫,两人一起把 bug 修好。
整体风格:温暖治愈的 3D 动画质感,柔和夜色灯光,参考皮克斯短片。

每一格请清楚标注:
- 镜头景别(全景 / 中景 / 特写)
- 角色动作
- 画面推进 / 转场
- 音效或配乐提示

底部加一条信息栏:角色设定、整体情绪基调、每格时间码(约 1.5 秒)。

把这段提示词拆开看,其实就是 5 个「字段」,像定义一个数据结构:

StoryboardSpec {
  base    : 比例 + 网格(16:9,3 列 x 3 行,共 9 格)
  style   : 风格参考(导演 / 影片 / 画风)
  shots[] : 逐格的 { 景别, 角色动作, 转场, 音效 }
  visual  : 色板 / 光线 / 整体调性
  footer  : 角色设定 + 情绪基调 + 时间码 + 技术规格
}

5 个字段里,shots[] 这个数组是关键。每格都写齐「镜头 + 动作 + 音效」三件套,模型读到这种分镜语言,才会按叙事逻辑去排版,而不是糊成一张普通插画。这跟接口定义一样——字段缺了,下游(模型)就只能瞎猜。

二、参数:比例和清晰度别用默认值

分镜图的可读性,一半取决于这两个参数:

  • 比例:影视、广告横版用 16:9;竖屏短视频、小红书用 9:16
  • 清晰度:选 2K,每格里的小字(景别、时间码)才看得清;要打印贴在拍摄现场就上 4K
  • 出图大概等 40 秒,整张 9 格一次成型。

两个高频踩坑点,权当「编译错误」记一下:

  1. 别省略 音效 / 转场 字段。只写画面 = 格子之间没有叙事关系,模型当插画处理;
  2. 格数和网格要写死,例如「3x3 共 9 格」「3x2 共 6 格」。不写死,它会随意拼贴,格数飘忽——相当于没加约束的循环。

三、迭代策略:像调 bug 一样收敛

AI 生成有随机性,第一版不可能完美。我的迭代套路,和定位线上问题的思路一模一样——缩小改动范围,单点验证

  • 整体不满意:提示词不动,重新生成一张(换随机种子),相当于「重跑一次」;

  • 只有某一格不对:局部重绘,针对性补一句,例如

    只重画第 5 格,改成低角度仰拍,其余格子保持不变。

    这就是把「全量重建」降级成「热修一格」;

  • 想统一换风格(3D 改铅笔手绘):在编辑指令里追加风格描述,不用重写整个故事。

一条反复验证的经验:一次只改一格、一件事。批量改需求的成功率,远低于小步提交。和写代码一个道理——大 PR 难 review,大改动难收敛。

四、沉淀成模板,长期复用

整套流程其实就两步:

  1. 用「base + style + shots[] + visual + footer」五段式提示词,让模型一次出图;
  2. 不满意就重抽,或局部重绘改单格。

把提示词存成模板,之后每次只改 故事概念整体风格 两个字段就能复用,跟函数复用一样。不同题材都能套:

题材 网格 要点
电影 / 短片 6 格 铅笔马克笔制作稿风格
动画 / 角色短片 12 格 提示词里强调「角色一致性」
广告 TVC 9 格 叠加产品照做图生图
科幻 / 概念 12 格 重点描述光照与氛围

小结

「画分镜」听着是美术活,落到提示词上其实是一道结构化工程题:定义清楚 spec、写死约束、小步迭代。掌握这套五段式模板,不会画画也能稳定产出专业分镜。


文中演示用的是 Image-2.net。方法论是通用的——任何支持中文提示词、可设定比例与清晰度的图像模型,换上去都适用。