惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

L
LINUX DO - 热门话题
Stack Overflow Blog
Stack Overflow Blog
B
Blog
WordPress大学
WordPress大学
Project Zero
Project Zero
P
Palo Alto Networks Blog
阮一峰的网络日志
阮一峰的网络日志
博客园 - 司徒正美
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
小众软件
小众软件
T
Tailwind CSS Blog
Forbes - Security
Forbes - Security
F
Full Disclosure
SecWiki News
SecWiki News
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Hacker News: Ask HN
Hacker News: Ask HN
C
Check Point Blog
Microsoft Security Blog
Microsoft Security Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
F
Fortinet All Blogs
Cisco Talos Blog
Cisco Talos Blog
G
Google Developers Blog
J
Java Code Geeks
Google DeepMind News
Google DeepMind News
人人都是产品经理
人人都是产品经理
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Recorded Future
Recorded Future
O
OpenAI News
Spread Privacy
Spread Privacy
MongoDB | Blog
MongoDB | Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
C
Cybersecurity and Infrastructure Security Agency CISA
S
Securelist
V
Vulnerabilities – Threatpost
Y
Y Combinator Blog
IT之家
IT之家
U
Unit 42
腾讯CDC
S
Security Affairs
C
Cisco Blogs
Schneier on Security
Schneier on Security
The Last Watchdog
The Last Watchdog
B
Blog RSS Feed
宝玉的分享
宝玉的分享
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
S
Security @ Cisco Blogs
Cyberwarzone
Cyberwarzone
T
The Blog of Author Tim Ferriss

产品发布

[产品自荐] 业余两周做了个 AI Visual Agent,自动选模型、写 prompt、调参数,想请 V 友帮忙看看 vibecodeing 了一个 韩语词典 南韩词典 目前只有 ios 版本 推广下下 做了一个记录你各种 Vibe Coding 的 Token 使用量的工具 - V2EX 职场社交新玩法: Queens Answer Today 平台正式发布,助你玩转 LinkedIn 益智挑战 - V2EX ACE-Step 1.5:性能超越 Suno 的端侧开源音乐模型 - V2EX 开发了动漫自走棋《Anime Auto Chess》主题站 - V2EX 做的第一款 AI 工具产品 - V2EX 做了一个 Dragon Traveler 的游戏主题站 - V2EX 鼓捣了一个拼图网站 Collaigo,非常好用,大伙可以试下 - V2EX
[产品自荐] 做了一个多模型 AI 图片/视频生成工作台,想请 V 友帮忙看看 Agent 选模型是否靠谱
yestwind · 2026-05-05 · via 产品发布

大家好,我是 CreateVision.ai 的作者。最近在做一个 AI 图片/视频生成工作台:

https://createvision.ai/?utm_source=v2ex&utm_medium=community&utm_campaign=feedback

最初想解决的问题很简单:现在图片/视频模型太多了,普通用户其实不知道该选 GPT Image 2 、Seedream 、Nano Banana 、Qwen Edit ,还是 Seedance / Veo / Kling 。

所以我做了一个 Ava Agent 的测试版,目标是让用户只描述想做什么,然后由系统帮忙做三件事:

  • 判断这是文生图、图生图、多图融合,还是视频任务
  • 自动优化 prompt ,并尽量保留用户原意,不乱加东西
  • 推荐模型、比例、清晰度和大概积分成本;视频会先确认,不直接开跑

目前我自己感觉还有几个问题没完全想明白,想请 V 友拍砖:

  1. Agent 的“意图分析 + prompt 优化”到底有没有帮助,还是会显得啰嗦?
  2. 多模型选择这件事,对小白有价值吗?还是应该直接默认一个最强模型?
  3. 图片和视频放在同一个入口,会不会让首页太复杂?
  4. 如果是你们,会更想要“免费快速生成”,还是“更专业的模型/参数控制”?

目前已支持的方向大概是:

  • AI 图片生成 / 图生图 / 多图融合
  • GPT Image 2 、Seedream 、Nano Banana 、Qwen Edit 等图片模型
  • Seedance / Veo / Kling 等视频模型
  • 一些模板和提示词库

不是开源项目,主要是产品自荐。希望大家重点帮我看两个点:第一眼是否知道怎么用;生成前的模型推荐是否可信。

如果有认真反馈的 V 友,我可以手动补一些测试积分,方便多试几次。