惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

A
Arctic Wolf
T
The Blog of Author Tim Ferriss
月光博客
月光博客
Recent Announcements
Recent Announcements
V
V2EX
Microsoft Azure Blog
Microsoft Azure Blog
博客园 - 三生石上(FineUI控件)
P
Proofpoint News Feed
The Register - Security
The Register - Security
博客园 - 叶小钗
博客园 - Franky
The Cloudflare Blog
雷峰网
雷峰网
罗磊的独立博客
M
MIT News - Artificial intelligence
I
InfoQ
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 【当耐特】
Engineering at Meta
Engineering at Meta
N
Netflix TechBlog - Medium
爱范儿
爱范儿
博客园 - 司徒正美
Recorded Future
Recorded Future
酷 壳 – CoolShell
酷 壳 – CoolShell
Google DeepMind News
Google DeepMind News
Martin Fowler
Martin Fowler
Microsoft Security Blog
Microsoft Security Blog
F
Full Disclosure
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
B
Blog
大猫的无限游戏
大猫的无限游戏
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
腾讯CDC
WordPress大学
WordPress大学
小众软件
小众软件
K
Kaspersky official blog
Attack and Defense Labs
Attack and Defense Labs
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
Forbes - Security
Forbes - Security
aimingoo的专栏
aimingoo的专栏
IT之家
IT之家
The Last Watchdog
The Last Watchdog
N
News and Events Feed by Topic
B
Blog RSS Feed
S
Security @ Cisco Blogs
美团技术团队
量子位
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Cloudbric
Cloudbric
Hacker News - Newest:
Hacker News - Newest: "LLM"

人人都是产品经理

为什么你的产品找不到差异化?90%的失败都卡在第一步上(下) – 人人都是产品经理, 3年从30万到1300万用户、获2200万美元融资,这个AI教育产品用“抽卡”破解了获客难题 – 人人都是产品经理, 园区招商系统怎么做才能真正帮到去化?我加了这一个功能,推广链接转发400次阅读过万 – 人人都是产品经理, AI大事件:OpenAI发完网络安全模型又搞药物研发,小鹏汽车要抓”DeepSeek时刻” – 人人都是产品经理, 电商不是卖货,是一场更残酷的产品经理实战 – 人人都是产品经理, 没想到,活动营销又回来了! – 人人都是产品经理, 为何All-in海外KOC:一场关于AI时代窗口期的豪赌 – 人人都是产品经理, 重新理解企业的内部协作 – 人人都是产品经理, 苹果的 AI 战略到底是什么? – 人人都是产品经理, 医疗智能体·第2讲——合规护城河:等保、PIPL与HIPAA的架构实战 – 人人都是产品经理, 向量知识库五步法:从“答非所问”到“精准回复” – 人人都是产品经理, 鸿蒙PC三方库构建总指挥HPKBUILD(sha)库为例 – 人人都是产品经理, 何时该用LLM?AI产品经理的LLM设计指南 – 人人都是产品经理, 医疗信息领域的需求方、决策方、准入方以及关注点(二) – 人人都是产品经理, 即梦涨价:一场被误读的「傲慢」 – 人人都是产品经理, 面试AI PM必答题:Hermes和OpenClaw的区别,如何讲清楚业务价值 – 人人都是产品经理, AI的下一张船票:世界模型——AI产品经理必须理解的技术拐点 – 人人都是产品经理, 小红书做GEO,怎么让AI信你?记住这 3 个重要信息 – 人人都是产品经理, 5 家印度 AI 初创公司,看看印度 AI 再做什么 – 人人都是产品经理, AI项目跨团队协作:产品技术业务如何不打架 – 人人都是产品经理, Agentic Workflow(智能体工作流):让AI从”答案生成器”变成”数字员工” – 人人都是产品经理, lycium_plusplus 项目全景解读:OpenHarmony 三方库构建的“大管家” – 人人都是产品经理, 从爆单救火到前置履约:两套预采策略,把生鲜大促履约效率拉满 – 人人都是产品经理, 什么时候该补货?我用一轮数据做了一个决定 – 人人都是产品经理, 从“机械兜底”到“动态分流”:AI客服重复进线治理的4大底层逻辑 – 人人都是产品经理, 抖音拼效率,红书拼洞察 – 人人都是产品经理, 全民狂欢与退潮——为什么龙虾这波热潮冷却得如此之快? – 人人都是产品经理, Stripe押注!MPP重塑全球支付 – 人人都是产品经理, 小红书GEO:AI引用你的内容,不是因为你对,而是因为你看起来可信 – 人人都是产品经理, 前百度副总裁押注办公Agent,日韩付费爆发,Manus迎来强劲对手 – 人人都是产品经理, 企事业单位数字化的业务供需本质 – 人人都是产品经理, 医疗智能体·第1讲——医疗信息化重构:从“辅助软件”到“自主智能体”的范式转移 – 人人都是产品经理, 粉丝量就是空气!!! – 人人都是产品经理, 用户说“薯片碎了”,机器回“要买吗?”:意图识别的翻车与破局 – 人人都是产品经理, RAG召回准确率从75到90 我做对了这三件事 – 人人都是产品经理, AI大事件:Anthropic改收费、OpenAI发安全版、手术机器人纳入医保、阿里发布”秒悟” – 人人都是产品经理, Chrome 推出 Skills 新功能,Agent 重塑上网方式 – 人人都是产品经理, GitHub前创始人拿了a16z的1700万美元,做Agent时代的Git – 人人都是产品经理 拷贝或克隆其他 Flutter OH 项目到本地后无法运行 – 人人都是产品经理, 优惠券设计:优惠券创建 – 人人都是产品经理, 不用死磕文档!AI 助手 1 小时搞定飞书 CLI 安装 + 配置 + 知识库 – 人人都是产品经理, 用小龙虾做竞品分析报告:从2天到20分钟,我是怎么做到的 – 人人都是产品经理 用小龙虾做市场分析报告:搞懂这3个公式,市场规模不再靠猜 – 人人都是产品经理, 你早就在做 Harness 工程,只是不知道它叫这个名字 – 人人都是产品经理, Think Long就够?你可能想多了! – 人人都是产品经理, 货代SRM实战:供应商准入怎么做,才能让资源池不是通讯录而是可交付网络? – 人人都是产品经理, 如何做好用户调研?详解基本技巧 – 人人都是产品经理, 木鸟、途家、美团对打,平台春天行动开“卷” – 人人都是产品经理, 入职才发现公司不靠谱?小红书从业者求职避坑指南 – 人人都是产品经理, 美国 AI 三巨头联手封堵,中国 AI 突围之路在何方 – 人人都是产品经理, 小红书,放在需求对面的镜子 – 人人都是产品经理, AI 会带来大规模失业吗? – 人人都是产品经理, 从出单到补货前,我第一次犹豫:该不该放大? – 人人都是产品经理, Flutter 三方库鸿蒙化适配:5 种高效检查方式,快速判断是否需要适配 – 人人都是产品经理, 从做产品进阶拿结果:医美机构产品经理转岗科室运营经理 – 人人都是产品经理, 阿里HappyHorse,一场关于“Token经济”的阳谋 – 人人都是产品经理, To B AI:客户留存落地的观察与思考 – 人人都是产品经理, AI产品的“生命线”——数据采集、标注、清洗的产品化设计 – 人人都是产品经理, 谈谈AI Agent(二):当“孩子”能自己“体验世界”时,你该学什么? – 人人都是产品经理, UI/UX设计师的3层能力进阶,前两层让你活下来,第三层…才是真正的分水岭 – 人人都是产品经理, 2分钟 → 30秒,效率提升75%:B端产品经理如何用「规则枷锁」驯服AI幻觉? – 人人都是产品经理, 还没来得及学OpenClaw,来了个更猛的:Hermes Agent – 人人都是产品经理, AI日报:宇树机器人跑出10m/s刷新世界纪录 – 人人都是产品经理, 一文说透基金互金如何用情绪价值引导用户决策做转化 – 人人都是产品经理, 当浏览器开始替你”看”网页:AI 浏览器正在亲手拆掉它脚下的那张网 – 人人都是产品经理, 0代码,一天时间我Vibe Coding了个网站 – 人人都是产品经理, Hermes 和 OpenClaw 之争,Agent 的能力应该“装上去”还是“长出来”? – 人人都是产品经理 视频生成的“桌子”,字节Seedance 2掀完,阿里快乐马掀 – 人人都是产品经理, 从听不懂到完全信任:我的 Codex 深度产品体验 – 人人都是产品经理, 当虚拟偶像有了北京户口,与真人偶像还有什么区别? – 人人都是产品经理, 会说,远远比会做更重要 —— 对 SBTI 爆火现象的五层观察 – 人人都是产品经理, AI产品经理必看:当“搭环境”比“选模型”更重要,你的认知还在2024年吗? – 人人都是产品经理, 2026年AI产品商业化核心逻辑:从功能demo到规模化营收的3个必破卡点 – 人人都是产品经理, 京东围绕供应链,卷起裤腿下场的那些事儿 – 人人都是产品经理, SBTI一夜刷屏:它赢在了“太会说人话” – 人人都是产品经理, 折扣零售的真相:不是便宜,而是价值感! – 人人都是产品经理, 和甲方吵了一架,最后加钱做了——我学到的ToB产品经理生存法则 – 人人都是产品经理, 和几位小红书操盘手聊了8小时,干货全在这 – 人人都是产品经理, 智谱GLM-5.1登场,开源模型首超Opus4.6!!! – 人人都是产品经理 Anthropic收入凭什么反超OpenAI,终于有人把这事说清楚了 – 人人都是产品经理, 史上最有故事感的技术报告——Claude最强模型Mythos 7个极其精彩的细节 – 人人都是产品经理, 模型不是壁垒,Harness 也不是 – 人人都是产品经理, 抖音本地生活业务思考21 – 人人都是产品经理, Superpowers:145k Star的AI编码框架,到底是什么来头? Superpowers:145k Star的AI编码框架,到底是什么来头? – 人人都是产品经理, OpenAI 的路走错了,Anthropic Harness 解法启示:模型需要实践专科生 – 人人都是产品经理, 画原型图的前一步:设计站点地图 – 人人都是产品经理, 给 DeepSeek 的最后一封催更信 – 人人都是产品经理, 手把手教你用 Claude Code 搭建 AI 营销团队:5 个 Agent、12 项技能,独立完成研究、写作、设计全流程 – 人人都是产品经理, 你以为大模型在学语言?不,它在重新发明语言学 – 人人都是产品经理 所谓Skill,不过是AI时代的工业垃圾 – 人人都是产品经理, 聊一聊内容传播的几个方法 – 人人都是产品经理, 当平台开始吃掉生态:从 OpenClaw 被封杀,读懂 Anthropic 的这盘棋 – 人人都是产品经理, 你装了 10 个 AI 插件,Obsidian 还是一个文件夹 – 人人都是产品经理 关于AI智能体架构演进的系统性思考:从单体试水到多体协同的重构 – 人人都是产品经理, 当“人”变成Skill,我们又该何去何从? – 人人都是产品经理 Mythos 事件:前沿 AI 治理的意外实验 – 人人都是产品经理, 货代CRM:信用与风险管理怎么做,才能把坏账风险拦在放货之前? – 人人都是产品经理, 从HR收集自拍照到员工自助录入——我见证了园区人脸识别从”不可用”到”真好用”的全过程 – 人人都是产品经理 千问闯关AI混沌期:阿里画靶,吴嘉张弓,马云射箭? – 人人都是产品经理,
Sora诞生,国内AI该怎么办?
科技云报到 · 2024-02-29 · via 人人都是产品经理

Sora的出现引起了国内外科技圈人士的广泛关注,有关国内外AI行业发展的问题,也被摆到了台面上。当下,国内AI厂商需要思考如何调整战略,抓住机会窗口。

“跟不上的可能就要被淘汰了。”看到Sora演示视频后,从业10多年的动画制作师黄斌得出了这样的判断。

随着影视业失业潮呼声渐起,Sora的诞生也给中国AI行业带来了巨大的焦虑。

360集团创始人周鸿祎认为,Sora模型展现出了超越当前中国同类产品的性能和技术水平,这不仅体现在Sora可能实现通用人工智能(AGI)的时间表上,还体现在其实际应用效果和创新能力上。

更有甚者,网上流传着“Sora的诞生是牛顿时刻”的说法,认为Sora代表了新一轮产业革命的兴起。

事实上,国内在经过“百模大战”之后,才刚刚在文本模型上取得显著成果,达到或超过GPT-3.5的水平,并正朝着GPT-4的方向努力追赶。

但Sora的诞生,展示了OpenAI在多模态模型而非单一文本领域的突破性进展,让国内AI厂商追上甚至超越OpenAI,几乎成了不可能完成的任务。

由此不少网友对中国AI发出质问:

为什么Sora没有诞生在中国?中国跟美国的AI差距越来越大,Sora这波国内慢了十年吧?永远都是在追赶路上,为啥没有原创?

在一句句灵魂版的拷问中,中国AI厂商集体陷入了沉默。

那么,在Sora这样的多模态大模型上,中美到底有多大差距?追赶的难点在哪儿?在种种限制之下,中国是否有自己的优势?

一、中美AI差距几何?

尽管OpenAI承认Sora仍处于开发的早期阶段,需要进一步完善,但业界已形成一个共识——Sora的推出标志着生成人工智能领域的一个重要里程碑。

这是因为Sora不仅仅是一个文生视频的工具,更是AGI的一个关键节点,它验证了一条通向AGI的可行技术路线。

和之前的GPT-3一样,Sora再次验证了Scaling Law可以在这个技术方向上继续发挥作用实现涌现。

而这背后,不仅是惊人的资本和算力支持的结果,更是通过无数工程实验试错和强大技术力量支持的结果。

不少人推断,OpenAI手里应该已经有一个基本完整的多模态GPT-5,可以根据需要随时释放其中的某一部分打击对手,或者引导舆论。

360集团创始人周鸿祎更是直接断言,Sora的出现,意味着AGI(人工通用智能)的实现将从10年缩短到1年。

事实上,在Sora面前,无论是现有的顶级AI模型如Pika、Runway等,还是在多模态AI上有投入的国内厂商,基本上都被“吊打”了。

这也侧面反映出中美在AI技术研发深度和资源投入上的差距。

首先,门槛来自算力。

虽然有学者认为Sora只是一个大约30亿参数的模型,训练成本并没有想象的高,但视频数据本身的处理、标注等成本,加上长视频在推理阶段注定的巨大token数量和算力消耗,显然对任何公司都是难以承受的挑战。

即便Sora真的只有30亿参数,视频分析对算力的消耗应该也是远远超过一个千亿模型的。在国内GPU被卡脖子之后,算力是一个巨大的挑战。

其次,是高质量的数据。

根据OpenAI发布的技术报告,Sora强大能力归功于两点:其一是使用了基于Transformer的扩散模型(Diffusion Model);其二是将不同类型视觉数据转化为统一格式——像素块(patch),从而能利用数量庞大、质量过硬且算力性价比高的数据。

业内人士认为,数据质量和数量上的显著优势,很可能是Sora成功的最关键因素之一。

在算力方面,虽然OpenAI训练Sora模型使用的GPU卡数量并非无法企及,但其他公司在具备足够硬件资源的情况下,仍然难以复制OpenAI的成功,主要瓶颈还是在于如何获取和处理大规模高质量的视频数据。

2022年,OpenAI曾宣布以创新方法来训练AI模型,省去标注大量资料的训练过程。

据报道,OpenAI所公布的视频预训练模型(VPT),让AI学会了在《我的世界》里从头开始造石镐。

研究人员首先收集一波数据标注外包们玩游戏的数据,其中包含视频和键鼠操作的记录。

然后,利用这些数据制作逆动力学模型(IDM),从而推测出视频里每一步在进行的时候,键鼠都是怎么动的。这样只需比原来少很多的数据就可以实现目的。

这项研究发表于2022年6月,同时文中还注明这个工作已经进行了一年之久,也就是说,OpenAI至少从2021年起就开始进行这项研究。

Logenic AI联合创始人李博杰认为,OpenAI的先发优势决定了早期的数据壁垒,对于后进入市场的公司来说,增加了追赶的难度。

“即使是谷歌这样全球数据量最大的公司,在训练大模型时,训练数据也未必能比OpenAI更好”,李博杰表示。

相比之下,国内公司在数据上的积累和利用上也存在一定差距:一方面,由于政策变化和其他限制,后来者可能无法获取之前可用的一些关键数据;另一方面,随着AI生成内容越来越多地充斥互联网,原始的真实世界数据被“污染”,使得获取高质量、无偏见的训练数据更加困难。

最后,是创新的训练方法。

Sora实现了将Transformer和扩散模型结合的创新,首先将不同类型的视觉数据转换成统一的视觉数据表示(视觉patch),然后将原始视频压缩到一个低维潜在空间,并将视觉表示分解成时空patch(相当于Transformer token),让Sora在这个潜在空间里进行训练并生成视频。

接着做加噪去噪,输入噪声patch后,Sora通过预测原始“干净”patch来生成视频。

OpenAI发现,训练计算量越大,样本质量就会越高,特别是经过大规模训练后,Sora展现出模拟现实世界某些属性的“涌现”能力。

总的来说,Sora是好的架构+好的数据,然后把模型做大,达到量变到质变。

尽管Sora在方案设计上大部分是已有的技术,但能够做出惊艳效果的也只有Sora,这也说明在训练过程中有很多训练技巧的问题要解决。

二、中国AI厂商能否追赶OpenAI?

Sora的技术突破让AI焦虑在国内蔓延开来,但中国AI并非完全无招架之力。在Sora出现并占据大众视野之前,国内也曾有多家上市公司在多模态AI方面展开过布局。

2023年12月18日,东方证券在一份研报中提及,国内的海康威视、大华股份、萤石网络等视频分析行业领先厂商,纷纷投入到多模态大模型研究和行业应用落地进程。

与此同时,百度、阿里、腾讯、华为、字节跳动等大厂也都布局了多模态基础大模型。

据不完全统计,2023年12月至今三个月内,已有包括万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信等在内的十余家A股公司,在投资者互动平台披露过视频生成模型领域的业务情况。

尽管目前国内厂商呈现的“文生视频”效果远不如Sora,但Sora所用到的基础模型LLM、文生图模型DALL·E 3、大规模视频数据集、AI算力体系、大模型开发工具栈等核心基础设施,中国都已经具备。

比如原创的基础大语言模型文心一言、讯飞星火、BAICHUAN等,以及文生图模型文心一格、腾讯混元等,加上过去一年大模型基础设施的突飞猛进,有能力和条件支持中国AI修成正果,在视频生成赛道再现类似ChatGPT式的成功。

腾讯研究院资深专家王鹏认为,Sora的发布进一步明确了DiT(=VAE编码器+ViT+DDPM+VAE解码器)是多模态AI的可行方向,中国AI大厂仍然有可能以现有资源在一年左右接近Sora目前的水平。

三、中国AI的机会

事实上,不仅是技术代际差异并没有想象中的那么大,视频生成模型走向行业的长跑才刚刚开始。大模型的价值需要商业化来证明,Sora也不例外。

首先,相比“人人皆可上手”的大语言模型,视频生成模型的应用门槛更高,受众群体更小。目前OpenAI仅开放给创作者使用,而非像ChatGPT那样开放给大众。

不难看到,视频生成模型从研发到落地,整个过程会更加缓慢,应用潜力与商业出口还有待探索。

其次,Sora虽然强大,但成本确实是一个现实问题。

有人估算,Sora生成一条视频的成本在几美元到几十美元不等,如果普及到大众使用,成本需要降到目前的1%才能接受。

降低成本的同时提高生成质量和逻辑连贯性,是亟待解决的关键挑战。

同时,考虑到无法解决“幻觉”的问题,要想生成真正可控可用的视频,短期内成本高昂。

这些局限性,都为中国AI产学各界留下了较长的追赶窗口期。

目前,Sora能够激活多大的商业价值尚不明确,但是利用大模型找应用场景却是中国市场的优势所在。

中国拥有丰富的行业和场景,如果中国AI厂商能为垂直的行业用户解决具体的场景问题,打磨好工具,做好视频生成模型的提示词工程,以便非专业背景的广大行业用户们上手使用,那么在特定领域超过GPT-4甚至是GPT-5的可能性是非常大的。

不仅如此,中国AI厂商也可以在Sora等大模型的基础上,做进一步的应用创新,例如在Sora之上能够提供更复杂的视频剪辑能力、革新医疗教学与模拟训练等,从而率先探索出商业化之路。

结语

Sora作为人工智能视频生成技术的重大突破,显示了中美之间存在显著的技术差距。这对于中国科技界而言,既是警醒也是鞭策。在承认现实差距的同时,中国AI也不必妄自菲薄,审视自我、调整战略、奋起直追,抓住机会窗口,才是弯道超车的必由之路。

原文标题:Sora阴影之下,焦虑的中国AI

来源公众号:科技云报到(ID:ITCloud-BD),云计算、网络安全、人工智能、大数据、区块链领域垂直新媒体。

本文由人人都是产品经理合作媒体 @科技云报到 授权发布,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。