惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

I
InfoQ
F
Full Disclosure
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
T
Threatpost
AWS News Blog
AWS News Blog
The GitHub Blog
The GitHub Blog
G
GRAHAM CLULEY
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
P
Palo Alto Networks Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
Latest news
Latest news
S
SegmentFault 最新的问题
C
Cisco Blogs
T
Tenable Blog
爱范儿
爱范儿
H
Hackread – Cybersecurity News, Data Breaches, AI and More
S
Securelist
S
Schneier on Security
博客园 - 三生石上(FineUI控件)
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Microsoft Azure Blog
Microsoft Azure Blog
C
CERT Recently Published Vulnerability Notes
NISL@THU
NISL@THU
T
Threat Research - Cisco Blogs
IT之家
IT之家
博客园_首页
C
Cyber Attacks, Cyber Crime and Cyber Security
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
K
Kaspersky official blog
aimingoo的专栏
aimingoo的专栏
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
P
Privacy International News Feed
腾讯CDC
A
About on SuperTechFans
Y
Y Combinator Blog
月光博客
月光博客
C
Check Point Blog
Last Week in AI
Last Week in AI
Know Your Adversary
Know Your Adversary
Hugging Face - Blog
Hugging Face - Blog
U
Unit 42
WordPress大学
WordPress大学
T
The Exploit Database - CXSecurity.com
H
Hacker News: Front Page
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
V
Vulnerabilities – Threatpost
Cyberwarzone
Cyberwarzone
L
LINUX DO - 热门话题
MongoDB | Blog
MongoDB | Blog
T
Troy Hunt's Blog

产品发布

[产品自荐] 业余两周做了个 AI Visual Agent,自动选模型、写 prompt、调参数,想请 V 友帮忙看看 vibecodeing 了一个 韩语词典 南韩词典 目前只有 ios 版本 推广下下 做了一个记录你各种 Vibe Coding 的 Token 使用量的工具 - V2EX 职场社交新玩法: Queens Answer Today 平台正式发布,助你玩转 LinkedIn 益智挑战 - V2EX ACE-Step 1.5:性能超越 Suno 的端侧开源音乐模型 - V2EX 开发了动漫自走棋《Anime Auto Chess》主题站 - V2EX 做的第一款 AI 工具产品 - V2EX 做了一个 Dragon Traveler 的游戏主题站 - V2EX 鼓捣了一个拼图网站 Collaigo,非常好用,大伙可以试下 - V2EX
[产品自荐] 做了一个多模型 AI 图片/视频生成工作台,想请 V 友帮忙看看 Agent 选模型是否靠谱
yestwind · 2026-05-05 · via 产品发布

大家好,我是 CreateVision.ai 的作者。最近在做一个 AI 图片/视频生成工作台:

https://createvision.ai/?utm_source=v2ex&utm_medium=community&utm_campaign=feedback

最初想解决的问题很简单:现在图片/视频模型太多了,普通用户其实不知道该选 GPT Image 2 、Seedream 、Nano Banana 、Qwen Edit ,还是 Seedance / Veo / Kling 。

所以我做了一个 Ava Agent 的测试版,目标是让用户只描述想做什么,然后由系统帮忙做三件事:

  • 判断这是文生图、图生图、多图融合,还是视频任务
  • 自动优化 prompt ,并尽量保留用户原意,不乱加东西
  • 推荐模型、比例、清晰度和大概积分成本;视频会先确认,不直接开跑

目前我自己感觉还有几个问题没完全想明白,想请 V 友拍砖:

  1. Agent 的“意图分析 + prompt 优化”到底有没有帮助,还是会显得啰嗦?
  2. 多模型选择这件事,对小白有价值吗?还是应该直接默认一个最强模型?
  3. 图片和视频放在同一个入口,会不会让首页太复杂?
  4. 如果是你们,会更想要“免费快速生成”,还是“更专业的模型/参数控制”?

目前已支持的方向大概是:

  • AI 图片生成 / 图生图 / 多图融合
  • GPT Image 2 、Seedream 、Nano Banana 、Qwen Edit 等图片模型
  • Seedance / Veo / Kling 等视频模型
  • 一些模板和提示词库

不是开源项目,主要是产品自荐。希望大家重点帮我看两个点:第一眼是否知道怎么用;生成前的模型推荐是否可信。

如果有认真反馈的 V 友,我可以手动补一些测试积分,方便多试几次。