惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

U
Unit 42
S
Securelist
小众软件
小众软件
WordPress大学
WordPress大学
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
B
Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
The GitHub Blog
The GitHub Blog
Apple Machine Learning Research
Apple Machine Learning Research
博客园 - 司徒正美
博客园 - Franky
Hugging Face - Blog
Hugging Face - Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
酷 壳 – CoolShell
酷 壳 – CoolShell
O
OpenAI News
Cloudbric
Cloudbric
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
TaoSecurity Blog
TaoSecurity Blog
MongoDB | Blog
MongoDB | Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
V
V2EX
PCI Perspectives
PCI Perspectives
T
Troy Hunt's Blog
Schneier on Security
Schneier on Security
P
Palo Alto Networks Blog
M
MIT News - Artificial intelligence
V2EX - 技术
V2EX - 技术
阮一峰的网络日志
阮一峰的网络日志
Hacker News - Newest:
Hacker News - Newest: "LLM"
G
Google Developers Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
The Last Watchdog
The Last Watchdog
The Register - Security
The Register - Security
腾讯CDC
N
News and Events Feed by Topic
C
Check Point Blog
爱范儿
爱范儿
T
Tailwind CSS Blog
Webroot Blog
Webroot Blog
P
Proofpoint News Feed
S
Schneier on Security
MyScale Blog
MyScale Blog
N
News | PayPal Newsroom
Recorded Future
Recorded Future
T
Tenable Blog
I
InfoQ
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Microsoft Security Blog
Microsoft Security Blog
Simon Willison's Weblog
Simon Willison's Weblog
Engineering at Meta
Engineering at Meta

少数派

派早报:Google 发布 Fitbit Air 等 - 少数派 「新人报到」確認需求,再開始 - 少数派 从 SOLO 独立开发者社区,我看到了越来越多开发者开始做自己的产品 - 少数派 我怎么管理那些"不常做,但总会忘"的生活事项 - 少数派 人形机器人量产元年,数据才是具身智能的“生死线” - 少数派 BuhoLaunchpad 高度还原 Mac 启动台:开发历程与思考 - 少数派 五年陪伴依然不舍,DIY 换壳后让罗技 MX Master 3 继续服役 - 少数派 新玩意 240|少数派的编辑们最近买了啥? - 少数派 一日一技|为什么你应该关闭 iOS 的键盘声音 - 少数派 我做了个插件和 Skills,一键提取任何网站的设计规范 Design.md - 少数派 住在三四线城市的你,该开始录播客了 - 少数派 甘南秘境,大白高国 - 少数派 AI的审美:谁让把我变成川内倫子 - 少数派 返工怎能不烦恼,打工人片单总有一部是你的「嘴替」 - 少数派 为了让「上厕所」更健康,我做了一个小工具 - 少数派 AI + Skill,能够让生成的文章去除 AI 味吗? - 少数派 新玩意|韶音OpenDots ONE 耳夹式耳机 - 少数派 《美满》| 在每一个春天的晚上相爱(362) - 少数派 新玩意|优篮子 PS01 MagSnap 磁吸支架 - 少数派 自我整合手记 | 我开始早睡了:用稳定规则,为自由托底 - 少数派 用龙虾(OpenClaw)两个多月,我最深的12个体会 - 少数派 听歌时间到,12 张你可能错过的 2025 华语乐坛好专辑 - 少数派 承诺能追吗 - 少数派 macOS 26启动台没了? 我做了个不一样的App启动器 - Keboard - 少数派 《四海为家的人》| INTJ对话INTJ(361) - 少数派 你发过的那些黑历史,是时候一次清干净了 - 少数派 新玩意:安安静静玩,越玩越专注:计客密码机 - 少数派 iPad 用户首次体验 Android 平板:vivo Pad6 Pro - 少数派 数据逻辑强 - 少数派 极北行+ | 一路向北,探访日本至北之地 | 001 - 少数派 万字剖析:千问App深度体验报告(2026) - 少数派 在2026年,如何真正防止别人抄袭你的作品 - 少数派 怎么用 50 块搭个 AI 语音助手?我踩了 3 天坑 - 少数派 YeeroAI:让 AI 对话真正成为知识管理的一部分 - 少数派 爬泰山 - 少数派 「旅图显影」 App 更新:这次,我们补上了一点「手感」 - 少数派 假期出门太折磨?我的 23 条经验帮你规划惬意旅行 - 少数派 工作流会变吗 - 少数派 Claude Opus 4.6 怎么用最省钱?我测了 5 种方案 - 少数派 GPT Image 2 让图文并茂不再稀罕 - 少数派 用户侧出发——什么是AI,我要不要学习? - 少数派 找片、转存、整理、播放一条龙!让你的付费网盘值回票价 - 少数派 欢迎试用!日课一问2.0插件 - 少数派 自己做的MDeditor,原本想购买 Typora 试了两次支付不成功,干脆自己做一个 - 少数派 vibe coding了一个 3MB 的小工具,让 ~/Downloads 彻底告别混乱 - 少数派 因为受不了 Mac 的风扇策略,我做了一个风扇控制工具 - 少数派 别只怪模型 - 少数派 Warp 终端的 AI 功能怎么用?我测了一周的体验 - 少数派 AI 写代码老是出 bug?这 5 个配置我后悔没早知道 - 少数派 「新玩意」苹果出相机可能就这样:Sigma BF + 45mm F2.8 DG Contemporary - 少数派 一个面向2030年的AI操作系统是什么样子的:浅谈cola这款有灵魂的Agent - 少数派 别只看写代码 - 少数派 每天解决10个问题,还是一口气攻坚解决400个? - 少数派 AI 交易机器人怎么搭?我用 Claude 跑了一周实盘 - 少数派 Maptoposter Online:把你爱的城市画成艺术海报 - 少数派 Function Calling 怎么用?我测了 3 个模型发现差距真大 - 少数派 Legend Talk:我做了个 AI 圆桌,让 160 位思想家围着你的问题转 - 少数派 如何找到自己的蓝方?在小县城寻找压力测试 - 少数派 语音输入与软件接口|2026年聊AI时,我们都聊些什么(上) - 少数派 混动已经卖爆,纯电又来补刀——钛7闪充版简直“不讲武德” - 少数派 本月玩什么|朋友收藏、识质存在、沙罗周期 - 少数派 为什么要每天坚持输出? - 少数派 Claude API 挂了好几个小时,你的项目有备用方案吗? - 少数派 Function Calling 没你想的复杂——我用它做了个有点用的工具 - 少数派 登录系统立即播放视频或者图片音乐的软件 - 少数派 我为什么创建 FlipHTML5 下载工具 - 少数派 残局没电?多品牌外设电量统一管理软件EasyBluetooth已支持RTSS游戏内显示以及AIDA64 - 少数派 前往通义路的路 - 少数派 太好看了,媲美Sun的个人导航页,NAS部署星云门户 - 少数派 乌黑嘴唇“一键检测”上线了 - 少数派 派早报:Claude AI 接入多个创意软件生态、FILCO 生产方接手品牌等 - 少数派 【更新】BearCLI、Claude 连接器与 MCP 服务器 - 少数派 记了上千条流水,还是看不懂财务?我做了一个让 AI 读懂账本的工作台 - 少数派 MINI R56 升级原厂 Sport 模式 - 少数派 新玩意 | 一棵柠檬树(仿真版) - 少数派 Momenta的“物理AI”野望,需迈过“含摩量”这道关 - 少数派 网页直接投屏控制手机!NAS一键部署PandaScrcpy,流畅丝滑可远程。 - 少数派 众测|邀你一同探索随身 AI 硬件入口 YoooClaw C·ONE - 少数派 2050大会:分享时间是真诚 参会记 - 少数派 iPad 赋能电影创作:国内首部宣纸手绘长片《燃比娃》的幕后故事 - 少数派 AI的审美:我用 8 个大模型给 100 张旅行照片打分 - 少数派 普通人如何破圈?去参加一个本地协会 - 少数派 把极空间的图标全换了,主题DIY全攻略打造你的专属NAS桌面 - 少数派 电子便签墙,帮你实现便签自由 - 少数派 我如何用三个 CLI 工具取代文档创建需求 - 少数派 原来真的有人可以玩一辈子 - 少数派 社区速递 139 | 派友热议三月买了啥、复古单反尼康 Df 体验 - 少数派 06 作品的赏析与评价 - 少数派 TDS REVIEW|索尼 WF-1000XM6 降噪真无线耳机体验 - 少数派 35.98万起售的第二代腾势D9,我看重的不是堆料,而是不凑合 - 少数派 鼠须管 Squirrel 皮肤配置指北 - 少数派 从watch ultra2换到redmi watch6 - 少数派 派早报:阿里巴巴发布视频生成模型 HappyHorse 1.0 等 - 少数派 别迷信1M - 少数派 家人们天塌了!网盘“大封杀”,多个渠道多条路,NAS部署PanHub - 少数派 AI与人勾心斗角!NAS一键部署AI狼人杀,假日休闲必备。 - 少数派 电商必备!Comfyui工作流批量生图插件,一次生成12张!支持Nano banana pro模型 - 少数派 Comfyui工作流配置Gpt-image-2模型教程,0.03/张 - 少数派 OpenClaw第三方APi怎么配置?可使用Gpt-image-2模型 - 少数派 会员社区话题精选 Ep. 103 - 少数派
12大场景一手横测GPT Image 1.5和香蕉2,我找到OpenAI不开发布会的原因了 - 少数派
2025-12-19 · via 少数派

还是怀念OpenAI发布会的日子,

至少不会就提前两小时发个预告,所有人熬夜等更新,这次更新的GPT Image 1.5有更强的指令遵循,更精准的图像编辑,生成速度比之前快了四倍,而且已经全量全用户上线了,

还上了一个新的粉粉的使用界面,

Image

这次他们放出来的cases基本就是照着Banana2来的,多文本生成,文字信息海报,世界知识等等,那我肯定要满足他们的愿望,来一个GPT Image 1.5和Banana2世纪大PK,十二个场景一次性看爽!

老规矩所有提示语和图片都打包了,评论区回复“gpt生图”就行

先来个6*6网格多元素生成的地狱case热热身,

绘制一个6x6的网格

创建一个6列×6行的网格,内容如下:

第一行:希腊字母β、沙滩球、柠檬、机器人、鱼缸、青蛙

第二行:螳螂、昂贵手表、浴缸、太阳镜、彩色蝴蝶、信封

第三行:邮票、相框、热气腾腾的饺子、"奇迹"一词、滑雪板、字母Z

第四行:马桶、地铁代币、静音图标、香水瓶、蜻蜓、滑板头盔

第五行:蓝牙图标、数字13、绿色爱心、魔方、加拿大鹅、军用头盔

第六行:白色小狗、救生衣、绳结、键盘、纸巾盒、数字14

这是Banana2的,虽然单个元素的画风会比GPT Image 1.5顺眼,但确实列数超过了,有些元素重复生成,

Image

GPT Image 1.5,

Image

第一局用的是GPT Image 1.5的case,第二局轮到Banana2的主场了,

生成一张3:4的图片,画面上方用书法写着一首完整的《茅屋秋风所破歌》,内容是【完整全文】,每个字上方都要标注上汉语拼音,同时画面内容主要用水墨画的形式展示这首诗所表达的情景。

看来GPT Image 1.5的中文还没训练够完整,中文错字好高,反而是拼音注音的准确率还高点,

Image

Banana2做出来的长这样,

Image

OK。马上进入第三局世界知识PK,还是Banana2的主场case,这次就直接开始图生图了,

Image

这是中国最高桥梁花江峡谷大桥的照片,描述这个桥梁的基本信息,图像标题为花江峡谷大桥的中英文并有矩形框,包括尺寸,宽度,高度,主缆长度,建成日期等,保证原图不变,信息以手写标注的形式添加在图中,并标在对应位置。在空白处画出桥梁主缆的剖面原理示意和悬索桥基本原理示意。

第一眼我真的有被唬到,

但我发现数值跟Banana2有点不太一样,这张图里桥面离水面的高度数据最大跨度是对的,其他的都是错误的。

Image

Banana2做出来的数据的正确率高很多,

Image

看来要降低一点难度,做点信息图或者海报了。

还有就是我真没有欺负GPT Image 1.5,生成过程也是会用到GPT 5.2补充知识的,所以通过经纬度还是可以做对应地点的历史海报的。

Image

用一组图,描绘公元前260年5月至10月之间,东经112°41到113°09′,,北纬35°39′到35°59′ 发生的事情,并给出详细的信息图,图上要用中文说明发生了什么事情,以及结果的重要信息

GPT Image 1.5,

Image

Banana2,

Image

测到现在感觉没啥悬念,1.5有点压不住2啊,

OpenAI还给GPT Image 1.5列出了几个小的质量更新,比方说生成非常非常非常非常多的小面孔也不会崩。

成千上万的人群聚集在上海东方明珠前。人群中每个人的脸都必须清晰可见。

Banana2做出来的长这样,

Image

一拉大的话从第四列的人开始脸就开始崩了

Image

但GPT Image 1.5做出来的这个真的会伪人到我做噩梦的程度,优化在哪了?

Image

还有什么能测的呢?

多图融合和精确修改还可测测看,

因为ChatGPT一次只能上传10个图片,所以我传了10个毛茸茸做多图融合

Image

一张中景照片,10 个毛茸茸的角色挤在一起,并排坐在磨损的米色布沙发上和地板上。他们都面向前方,看着放在沙发前低矮木桌上的一个复古木盒电视机。房间光线昏暗,左侧窗户透进温暖的光线,电视发出的光芒照亮了生物的面孔和毛茸茸的质感。背景是一个舒适、略显杂乱的客厅,有编织地毯、摆满旧书的书架,以及背景中的一些乡村风格厨房元素。整体氛围温暖、舒适且充满乐趣。

这个case就有点区分不出来哪个比较好了,两个都有漏角色,重复生成的,GPT Image 1.5是少生成了一个,Banana2是多生成了一个,

GPT Image 1.5,

Image

Banana2,

Image

图像修改的话,GPT Image 1.5刚好碰上Banana2更新了,上传图片的时候可以画圈,箭头,文字来指定修改,

图片

左侧case没找到出处,右侧是@歸藏佬做的

让GPT Image 1.5也挑战一下吧,

Image

画面我是真没太看出来明暗有什么变化,但是划线花圈文字啥的确实都抹除了,换个case来看会更加明显,三个不同颜色的圈圈成功了一个。

Image

OpenAI也主动承认了GPT Image 1.5在风格化上会比上一代要差,想要表现好的话可以用提供的滤镜,不过只有13种够谁用啊。

图片

再拉我也测试看看,

把图一(柯南)转真人,模仿图二的风格生成一个带2D插图元素的真人街拍

图片

可能是我做的时候对GPT Image 1.5没抱太大期望,这把他居然是还行的,

图片

左边是GPT Image 1.5右边是Banana2

把一张九宫格图做成完整视频目前应该是只有Sora2能做到,之前我都用Banana2做图的,今天刚好也试试看GPT Image 1.5做的效果。

Image

根据这张图片推测该场景的事件时间线,以电影分镜方式按发生顺序制作成9格分镜网格。

GPT Image 1.5生成的九宫格里面画风偏了我就不挑了,问题是这个九宫格它前后有逻辑顺序吗?

Image

Banana2做出来的逻辑性会强很多,

Image

当然我这个没有用原版的九宫格生成提示语(太长了放链接),

Banana2联动可灵正确玩法!我现在做Ai视频只要一张图就够了

那个是会分析图片里所有关键元素,强制对应真实世界里的某一个片子的。

GPT Image 1.5做出来的长这样,也没好多少。。。

Image

最后我用Grok汇总了一下两个模型的对比,

就更没想到GPT Image 1.5有啥竞争力了,

可能就是生图速度快点了,

但光快也没用啊。。。

Image

Greg给GPT Image 1.5站台做的case也被Banana2比下去了。

图片

对了对了,差点忘了当时Banana2惊艳我的线稿上色的case了,

给这张漫画页上色并翻译成中文放到图中原来的位置,保持构图和图片细节的一致

图片
图片

从左到右是原图,Banana2,GPT Image 1.5

还有还有还有,测到停不下来了,

从专业的角度详细解释AI视频生成模型的训练原理并制作一页蜡笔小新手绘风格的英文PPT,加入比较多的文字和案例进行辅助说明,让蜡笔小新带领大家一起学习的感觉,PPT页面比例16:9

Image

这一把又测到凌晨六点了,

该洗洗睡了,

这句话我送给我自己,

也送给GPT Image 1.5,

测试过程中发现Banana2懂中文已经把我养刁了,

别的缺点都可以忍,

不会中文是真忍不了一点

要不要考虑学学隔壁Sora2,

找点IP联名后再来挑战吧。

@ 作者 / 困得不行的卡尔