惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

P
Privacy International News Feed
Martin Fowler
Martin Fowler
D
Docker
Y
Y Combinator Blog
云风的 BLOG
云风的 BLOG
U
Unit 42
T
Tailwind CSS Blog
J
Java Code Geeks
G
Google Developers Blog
MongoDB | Blog
MongoDB | Blog
阮一峰的网络日志
阮一峰的网络日志
WordPress大学
WordPress大学
月光博客
月光博客
大猫的无限游戏
大猫的无限游戏
美团技术团队
F
Fortinet All Blogs
N
News and Events Feed by Topic
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Hacker News - Newest:
Hacker News - Newest: "LLM"
The GitHub Blog
The GitHub Blog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
Recorded Future
Recorded Future
N
Netflix TechBlog - Medium
Google DeepMind News
Google DeepMind News
Hacker News: Ask HN
Hacker News: Ask HN
L
LINUX DO - 最新话题
Microsoft Security Blog
Microsoft Security Blog
N
News and Events Feed by Topic
I
Intezer
TaoSecurity Blog
TaoSecurity Blog
NISL@THU
NISL@THU
小众软件
小众软件
博客园 - 聂微东
博客园 - Franky
有赞技术团队
有赞技术团队
P
Palo Alto Networks Blog
爱范儿
爱范儿
H
Hacker News: Front Page
C
Cyber Attacks, Cyber Crime and Cyber Security
C
Cisco Blogs
P
Proofpoint News Feed
I
InfoQ
Google DeepMind News
Google DeepMind News
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Vercel News
Vercel News
H
Heimdal Security Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Application and Cybersecurity Blog
Application and Cybersecurity Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
量子位

人人都是产品经理

为什么你的产品找不到差异化?90%的失败都卡在第一步上(下) – 人人都是产品经理, 3年从30万到1300万用户、获2200万美元融资,这个AI教育产品用“抽卡”破解了获客难题 – 人人都是产品经理, 园区招商系统怎么做才能真正帮到去化?我加了这一个功能,推广链接转发400次阅读过万 – 人人都是产品经理, AI大事件:OpenAI发完网络安全模型又搞药物研发,小鹏汽车要抓”DeepSeek时刻” – 人人都是产品经理, 电商不是卖货,是一场更残酷的产品经理实战 – 人人都是产品经理, 没想到,活动营销又回来了! – 人人都是产品经理, 为何All-in海外KOC:一场关于AI时代窗口期的豪赌 – 人人都是产品经理, 重新理解企业的内部协作 – 人人都是产品经理, 苹果的 AI 战略到底是什么? – 人人都是产品经理, 医疗智能体·第2讲——合规护城河:等保、PIPL与HIPAA的架构实战 – 人人都是产品经理, 向量知识库五步法:从“答非所问”到“精准回复” – 人人都是产品经理, 鸿蒙PC三方库构建总指挥HPKBUILD(sha)库为例 – 人人都是产品经理, 何时该用LLM?AI产品经理的LLM设计指南 – 人人都是产品经理, 医疗信息领域的需求方、决策方、准入方以及关注点(二) – 人人都是产品经理, 即梦涨价:一场被误读的「傲慢」 – 人人都是产品经理, 面试AI PM必答题:Hermes和OpenClaw的区别,如何讲清楚业务价值 – 人人都是产品经理, AI的下一张船票:世界模型——AI产品经理必须理解的技术拐点 – 人人都是产品经理, 小红书做GEO,怎么让AI信你?记住这 3 个重要信息 – 人人都是产品经理, 5 家印度 AI 初创公司,看看印度 AI 再做什么 – 人人都是产品经理, AI项目跨团队协作:产品技术业务如何不打架 – 人人都是产品经理, Agentic Workflow(智能体工作流):让AI从”答案生成器”变成”数字员工” – 人人都是产品经理, lycium_plusplus 项目全景解读:OpenHarmony 三方库构建的“大管家” – 人人都是产品经理, 从爆单救火到前置履约:两套预采策略,把生鲜大促履约效率拉满 – 人人都是产品经理, 什么时候该补货?我用一轮数据做了一个决定 – 人人都是产品经理, 从“机械兜底”到“动态分流”:AI客服重复进线治理的4大底层逻辑 – 人人都是产品经理, 抖音拼效率,红书拼洞察 – 人人都是产品经理, 全民狂欢与退潮——为什么龙虾这波热潮冷却得如此之快? – 人人都是产品经理, Stripe押注!MPP重塑全球支付 – 人人都是产品经理, 小红书GEO:AI引用你的内容,不是因为你对,而是因为你看起来可信 – 人人都是产品经理, 前百度副总裁押注办公Agent,日韩付费爆发,Manus迎来强劲对手 – 人人都是产品经理, 企事业单位数字化的业务供需本质 – 人人都是产品经理, 医疗智能体·第1讲——医疗信息化重构:从“辅助软件”到“自主智能体”的范式转移 – 人人都是产品经理, 粉丝量就是空气!!! – 人人都是产品经理, 用户说“薯片碎了”,机器回“要买吗?”:意图识别的翻车与破局 – 人人都是产品经理, RAG召回准确率从75到90 我做对了这三件事 – 人人都是产品经理, AI大事件:Anthropic改收费、OpenAI发安全版、手术机器人纳入医保、阿里发布”秒悟” – 人人都是产品经理, Chrome 推出 Skills 新功能,Agent 重塑上网方式 – 人人都是产品经理, GitHub前创始人拿了a16z的1700万美元,做Agent时代的Git – 人人都是产品经理 拷贝或克隆其他 Flutter OH 项目到本地后无法运行 – 人人都是产品经理, 优惠券设计:优惠券创建 – 人人都是产品经理, 不用死磕文档!AI 助手 1 小时搞定飞书 CLI 安装 + 配置 + 知识库 – 人人都是产品经理, 用小龙虾做竞品分析报告:从2天到20分钟,我是怎么做到的 – 人人都是产品经理 用小龙虾做市场分析报告:搞懂这3个公式,市场规模不再靠猜 – 人人都是产品经理, 你早就在做 Harness 工程,只是不知道它叫这个名字 – 人人都是产品经理, Think Long就够?你可能想多了! – 人人都是产品经理, 货代SRM实战:供应商准入怎么做,才能让资源池不是通讯录而是可交付网络? – 人人都是产品经理, 如何做好用户调研?详解基本技巧 – 人人都是产品经理, 木鸟、途家、美团对打,平台春天行动开“卷” – 人人都是产品经理, 入职才发现公司不靠谱?小红书从业者求职避坑指南 – 人人都是产品经理, 美国 AI 三巨头联手封堵,中国 AI 突围之路在何方 – 人人都是产品经理, 小红书,放在需求对面的镜子 – 人人都是产品经理, AI 会带来大规模失业吗? – 人人都是产品经理, 从出单到补货前,我第一次犹豫:该不该放大? – 人人都是产品经理, Flutter 三方库鸿蒙化适配:5 种高效检查方式,快速判断是否需要适配 – 人人都是产品经理, 从做产品进阶拿结果:医美机构产品经理转岗科室运营经理 – 人人都是产品经理, 阿里HappyHorse,一场关于“Token经济”的阳谋 – 人人都是产品经理, To B AI:客户留存落地的观察与思考 – 人人都是产品经理, AI产品的“生命线”——数据采集、标注、清洗的产品化设计 – 人人都是产品经理, 谈谈AI Agent(二):当“孩子”能自己“体验世界”时,你该学什么? – 人人都是产品经理, UI/UX设计师的3层能力进阶,前两层让你活下来,第三层…才是真正的分水岭 – 人人都是产品经理, 2分钟 → 30秒,效率提升75%:B端产品经理如何用「规则枷锁」驯服AI幻觉? – 人人都是产品经理, 还没来得及学OpenClaw,来了个更猛的:Hermes Agent – 人人都是产品经理, AI日报:宇树机器人跑出10m/s刷新世界纪录 – 人人都是产品经理, 一文说透基金互金如何用情绪价值引导用户决策做转化 – 人人都是产品经理, 当浏览器开始替你”看”网页:AI 浏览器正在亲手拆掉它脚下的那张网 – 人人都是产品经理, 0代码,一天时间我Vibe Coding了个网站 – 人人都是产品经理, Hermes 和 OpenClaw 之争,Agent 的能力应该“装上去”还是“长出来”? – 人人都是产品经理 视频生成的“桌子”,字节Seedance 2掀完,阿里快乐马掀 – 人人都是产品经理, 从听不懂到完全信任:我的 Codex 深度产品体验 – 人人都是产品经理, 当虚拟偶像有了北京户口,与真人偶像还有什么区别? – 人人都是产品经理, 会说,远远比会做更重要 —— 对 SBTI 爆火现象的五层观察 – 人人都是产品经理, AI产品经理必看:当“搭环境”比“选模型”更重要,你的认知还在2024年吗? – 人人都是产品经理, 2026年AI产品商业化核心逻辑:从功能demo到规模化营收的3个必破卡点 – 人人都是产品经理, 京东围绕供应链,卷起裤腿下场的那些事儿 – 人人都是产品经理, SBTI一夜刷屏:它赢在了“太会说人话” – 人人都是产品经理, 折扣零售的真相:不是便宜,而是价值感! – 人人都是产品经理, 和甲方吵了一架,最后加钱做了——我学到的ToB产品经理生存法则 – 人人都是产品经理, 和几位小红书操盘手聊了8小时,干货全在这 – 人人都是产品经理, 智谱GLM-5.1登场,开源模型首超Opus4.6!!! – 人人都是产品经理 Anthropic收入凭什么反超OpenAI,终于有人把这事说清楚了 – 人人都是产品经理, 史上最有故事感的技术报告——Claude最强模型Mythos 7个极其精彩的细节 – 人人都是产品经理, 模型不是壁垒,Harness 也不是 – 人人都是产品经理, 抖音本地生活业务思考21 – 人人都是产品经理, Superpowers:145k Star的AI编码框架,到底是什么来头? Superpowers:145k Star的AI编码框架,到底是什么来头? – 人人都是产品经理, OpenAI 的路走错了,Anthropic Harness 解法启示:模型需要实践专科生 – 人人都是产品经理, 画原型图的前一步:设计站点地图 – 人人都是产品经理, 给 DeepSeek 的最后一封催更信 – 人人都是产品经理, 手把手教你用 Claude Code 搭建 AI 营销团队:5 个 Agent、12 项技能,独立完成研究、写作、设计全流程 – 人人都是产品经理, 你以为大模型在学语言?不,它在重新发明语言学 – 人人都是产品经理 所谓Skill,不过是AI时代的工业垃圾 – 人人都是产品经理, 聊一聊内容传播的几个方法 – 人人都是产品经理, 当平台开始吃掉生态:从 OpenClaw 被封杀,读懂 Anthropic 的这盘棋 – 人人都是产品经理, 你装了 10 个 AI 插件,Obsidian 还是一个文件夹 – 人人都是产品经理 关于AI智能体架构演进的系统性思考:从单体试水到多体协同的重构 – 人人都是产品经理, 当“人”变成Skill,我们又该何去何从? – 人人都是产品经理 Mythos 事件:前沿 AI 治理的意外实验 – 人人都是产品经理, 货代CRM:信用与风险管理怎么做,才能把坏账风险拦在放货之前? – 人人都是产品经理, 从HR收集自拍照到员工自助录入——我见证了园区人脸识别从”不可用”到”真好用”的全过程 – 人人都是产品经理 千问闯关AI混沌期:阿里画靶,吴嘉张弓,马云射箭? – 人人都是产品经理,
文本大模型是怎么炼成的
AI产品泡腾片 · 2026-02-04 · via 人人都是产品经理

从N-gram的笨拙概率猜测到Transformer的量子阅读,AI已经完成了从7秒记忆到通用逻辑底座的惊人跃迁。2026年的文本大模型战场正演变为推理深度、工程效率和生态整合的多维战争,OpenAI、Google、Anthropic和DeepSeek各自押注不同未来。本文将带你穿透技术迷雾,看清那些让AI突然开窍的底层架构革命与工业炼金术。

2026 年的我们,已经很少再为“让AI干活”这件事感到惊讶了。

生活中遇到不懂的问题,下意识丢给豆包;查资料、写文章,DeepSeek、Chat GPT早已是默认选项;想生成简单视频,就找可灵或即梦。

这情景,就像人人都拥有了一个多啦A梦一样的魔幻。

从无人知晓,到小学生都开始用AI帮忙检查作业,也就只过去了两三年而已。

虽然大多数人已经把AI当成了一种“基础设施”,却很少有人去追问:这种能力究竟是怎么来的。

它看起来像是在某个瞬间突然出现的,但如果真的把时间轴拉开,就会发现,这条路走得一点也不突然,甚至可以说,走得相当艰难。

只有“7秒记忆”的AI祖先

在大模型称霸之前,AI 圈主要有两类“祖先”较劲。

一类是老派的 N-gram。它纯粹靠概率:看到“北京是中国的首”,它根据统计猜下一个token是“都”,它完全不理解什么是国家或城市,只是个没有感情的概率预测机。

另一类则是神经网络派的 RNN(循环神经网络)及其进化版 LSTM。它们是文本大模型的直系祖先,第一次引入了“记忆”。但它们的记忆是一个词一个词地听,再一个词一个词地记,读到第 50 个词时,第 1 个词已经模糊了。最致命的是,这种串行结构,也让算力无法真正发挥作用,再强大的 GPU,在这里都只能排队等待。

这种模型结构上的“天花板”,让 AI 的智力被死死锁在了原地。

在很长一段时间里,研究者们其实已经把能试的办法都试过了:更多数据、更复杂的门控、更深的网络、更大的参数量。但不管怎么折腾,模型依然被困在“顺序读取、逐步遗忘”的框架里。

Transfomer:大模型的火种

转机发生在 2017 年。

那篇名为《Attention Is All You Need》的论文,在 2017 年横空出世,论文标题看起来略有点傲慢:别整那些没用的,只要有“注意力”就够了。

它提出了一种在当时看来颇为激进的想法:完全抛弃循环结构,只用注意力机制来建模序列关系,模型不再按顺序一步步推进,而是一次性看到所有词,通过计算彼此之间的关联强度,来决定信息如何流动。

后来我们把这种结构称为 Transformer,也正是从这里开始,文本大模型的时代,才真正拉开序幕。

Transformer 放弃了串行处理方式,把“排队识字”变成了“量子阅读”,它引入了自注意力机制(Self-Attention),让模型学会了“找重点”,从此,机器可以同时处理整段文字,瞬间扫描并理解词与词之间跨越长距离的关联。

B站账号3Blue1Brown用视频清晰的解释了Transformer的原理,有兴趣可以去看原视频。

地址:https://www.bilibili.com/video/BV1TZ421j7Ke/?spm_id_from=333.1387.search.video_card.click&vd_source=46a6c59ab33ee91d2a13282c50bd501f

尴尬的是,Google 发明了火药,却没能点燃大烟花,这 8 位作者后来全部离开了 Google,散作满天星,成了 AI 创业浪潮里的主角。

其中最具代表性的,是一作 Ashish Vaswani。他离开后创立了Adept AI,试图把 Transformer 从“生成文本的模型”,推进到“能操作软件、完成任务的智能体”,继续探索模型与真实世界之间的连接方式。

另一位是 Noam Shazeer。他共同创立了Character.AI,把大模型带进角色扮演和情感陪伴等消费级场景,验证当语言足够自然时,人类会如何与模型建立关系。

其余作者则分散在基础研究、生物医药、分布式系统等不同方向。这种分散,本身说明了 Transformer 不仅是一种技术突破,更是一种底层通用的认知工具,点燃了一整代研究者和创业者对“智能可以如何生长”的想象力。

但有了 Transformer,并不代表智能就此诞生,要把这张图纸变成一个能写诗、会编程、懂情绪的数字生命,还需要经历一个极其漫长且昂贵的“淬炼”过程。

大模型是怎样“炼”成的?

有了 Transformer ,并不代表智能就诞生了,顶级模型公司与其说是实验室,不如说更像是一座精密运转的超级工厂。无论公司背景、文化和路线如何不同,训练文本大模型的底层流程,基本都绕不开三个阶段。

  • 预训练(Pre-training):这是整个工厂最昂贵的工序。模型要在数万亿 Token 的原始文本中,学会最底层的逻辑:“根据上文预测下一个词”。这一步决定了模型的知识广度和理解基础,也是最烧算力的阶段。
  • 指令微调(SFT):预训练后的模型虽然博学,但处于一种“混沌”状态,无法精准听从指令。此时,工程师会喂入几十万条高质量指令数据(这相当于给模型一套标准教材)。比如:告诉它当被要求“总结文档”时,输出的格式应该是怎样的。
  • 对齐(Alignment):这是让 AI “像人”的关键。通过 RLHF(人类反馈强化学习),让模型在不同的回答选项中学习人类的偏好。这一步不仅教它礼貌,更教它安全边界和逻辑审美。

我们大模型从业者常开玩笑说:有多少人工,就有多少智能。这不是开玩笑,不信你看。

在 2026 年,顶级大模型公司的内部已经形成了一条极其严密的“工业流水线”:

  • 数据:他们自嘲为“赛博矿工”,因为互联网上的原始数据 90% 都是垃圾,他们要通过上百道清洗工序,剔除乱码、噪音和低质量对话,还要像奶粉配方师一样,精控数据中代码、书籍、数学题的配比。
  • 系统工程:他们的任务是让几万张 GPU 像一台机器一样丝滑运转,在长达数月的训练周期里,任何一根网线的抖动、一个显卡的故障,都可能导致单日百万美元级别的损失。
  • 算法:这里的科学家负责“顶层设计”,他们通过改进损失函数和模型架构,去榨干算力的每一分潜力,他们决定了这颗大脑的“智力上限”。
  • 数据标注与专家团队:为了教 AI 写出顶级的代码或法律文书,公司必须雇佣真正的程序员、律师、文学家。他们通过成千上万次的打分、排序和纠错,把自己几十年的专业经验,硬生生地“蒸馏”进模型里。

这种大规模、高精度的精英协作,才是“智能”能够被稳定生产出来的真相。这套“炼金术”的门槛极高,而在这群“炼金术士”中,最激进、最不计代价的一群人,组成了 OpenAI。

OpenAI:Scaling Law最疯狂的信徒

在很长一段时间里,当许多研究者仍然试图通过更精巧的结构来提升性能时,OpenAI 内部始终存在一种坚定的信念:只要模型足够大、数据足够多,就会出现无法通过小规模实验预测的能力涌现。这种看似粗暴的路径背后,有一个绕不开的名字——Ilya Sutskever。

他长期坚持一个判断:智能并不是被“设计”出来的,而是会在足够大的模型和足够复杂的数据中自然涌现。后来从 GPT 系列到 ChatGPT 的一系列结果,逐步验证了这种判断的现实意义。

从 GPT-1 的尝试,到 GPT-2 的惊艳,再到 GPT-3 震撼世界。Open AI一次次打破了人类对机器智力的想象天花板。2022 年底 ChatGPT 的爆发,本质上就是对 Scaling Law“暴力美学”的一次集中体现。

虽然经历了一系列的“宫斗”事件,甚至那位曾指引航向的灵魂人物 Ilya 也最终选择了离开,但 OpenAI 已经完成了它最关键的历史使命:验证了 Scaling Law 在文本领域的普适性。

它对行业最实际的贡献,是把 AI 从“特定任务的专用模型”拉到了“通用逻辑底座”的赛道上。在 GPT 出现之前,工业界习惯于为每一个细分场景单独训练模型;而 OpenAI 证明了,只要基座模型的参数规模和预训练数据足够大,它就能通过极低成本的微调,适配绝大多数下游任务。这种工程范式的改变,直接降低了全球 AI 应用的开发门槛。

2026 年的 OpenAI 现状如何?

从产品表现上看,它正在经历从“预测概率”向“强化推理”的重心转移。

现在的 GPT-5系列 或 o系列 并不再一味追求更大的参数规模,而是引入了更多的测试时计算(Inference-time Compute)。说得通俗点,就是它学会了在输出答案前进行多次自我校对和逻辑推演。这种转变解决了早期 GPT 模型“说话不经大脑”的硬伤,使其在数学、编程和严谨的科研辅助领域更具可用性。

在商业层面,OpenAI 已经从一家研究机构彻底转型为一家极其务实的算力与 API 供应商。

它成功开辟了道路,但也因为这种成功,让它在 2026 年遇到了更多侧面战场的竞争。比如,当 OpenAI 还在死磕推理上限时,它的老对手 Anthropic 和黑马 DeepSeek,已经开始从“调性”和“性价比”上撕开缺口。

群雄割据

进入 2026 年,文本大模型的叙事已经从早期的“大力出奇迹”,演变为一场关于性格、生态与效率的多方混战

OpenAI 的核心竞争力已经从“参数量”转向了“推理时长”。GPT-5系列 已经不再追求秒回,而是通过强化学习在后台进行逻辑复核。它现在的角色是极其务实的高阶逻辑供应商,专门解决科学发现、架构设计等复杂长链条难题。

Google 走的是端到端生态路子,Gemini 3 的优势在于原生多模态(文本、音视频同步处理)以及与 Android、Workspace 的深度整合,通过全场景覆盖,让用户在查邮件、改文档、刷视频时无缝调用 AI。

Anthropic 依然占据着专业协作市场,Claude 5 的技术路径侧重于超长上下文的极高忠诚度。在处理数百万字的技术文档或法律合规审查时,它的幻觉率依然是行业最低的。

作为最大的黑马,DeepSeek 靠的是极致的工程创新,用不到硅谷厂商 20% 的训练成本,实现了同水平的推理性能,直接把全球大模型 API 的价格压到了近乎免费。

最后

回看文本大模型走过的这十年,人类其实只做对了一件事:我们终于找到了压缩并提取人类文明逻辑的最优解。

从 N-gram 那种笨拙的概率猜测,到 Transformer 这种“一眼万年”的架构,再到 2026 年各家大模型在推理深度上的极限拉扯,本质上都是在不断打磨那颗“数字大脑”的额叶皮层。

文本大模型已经完成了它的第一阶段使命——它向世界证明了,智能是可以被计算的。但如果你问我,2026 年的 AI 真的已经到达终点了吗?答案显然是否定的。

在大模型那看似全能的回答背后,其实还隐藏着几个足以改变行业走向的“秘密武器”:

  • 为什么有的模型参数巨大却运行飞快?这涉及到了模型里的“轮班制”——MoE(混合专家模型)
  • 为什么现在的 AI 能够一口气读完几十本小说而不健忘?这关乎它不断扩张的“内存条”——Context Window(上下文窗口)
  • 为什么最顶尖的模型在回答前要“沉默”几十秒?那是它在后台打草稿的“慢思考”过程——Inference-time Compute(测试时计算)

在下一篇文章里,我想跳出宏大的叙事,拆解这些支撑起 AI 智力的底层技术概念,我们下周见。

本文由 @AI产品泡腾片 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议