说实话最近工作没有太多需求,空下一些时间深夜做一些无所谓的瞎想。
众所周知的是,2023 年 gpt3 刚出来的时候大家可不像今天这么感觉大模型能完美替代几乎所有程序员工作。而 2023 年到现在也不过 3 年。那么,如果再把时间维度拉长到 3-5 年,我们的未来会是什么形态?
已知前提:
- 模型的提升本质上实际上是信息密度提升,存在边际效应,但是从 2026 回看过去三年,已经提升很多,未来仍有一定提升空间。
- nvdia 的硬件是存在高溢价的,仅从成熟制程集成电路技术的角度来说计算成本没有现在这么贵。
与大模型聊天后做出的推断性判断:
- 已知过去三年间低端模型(个人用户的消费级硬件有潜在希望能运行的模型,例如 64B 及以下模型)的部署成本大概降低了 1000 倍。
- 高端模型( 1-1.5T 参数)所依赖的部署设备的成本,如果能够去掉类似 cuda 护城河和 nv 溢价的话,未来也不会下降太多,但是下降 5 倍是可能的(也就是说类似于企业部署满血 deepseek v4 pro ,目前的成本比如是 300 万一台机器的话,未来理想情况下可能降低至 60 万,应该不会再低了)
- 目前看来可能的提升模型能力的方向,例如多 agent 任务流,消耗 token 数量大概是普通对话的 10 倍左右。
- 以当下的重度 LLM 用户的使用习惯来看(考虑人机交互中人类心智端的极限),取决于任务的不同,每天生成 token 数大概在 1M-100M 之间。
那么综合推断下来 3-5 年后的未来会存在这样一批人:
- 每天使用大模型综合 token 输出数量在 10M-1000M 之间。
- 使用多 agent 执行各种复杂任务
- 使用次旗舰级别开源模型,能力超过或与当下的旗舰模型持平(假设与 Fable5 持平)
- 每 1Mtoken 的输出成本,按现在的购买力计算,约与当下的 deepseek 官方 api 价格持平( 3-6 元每 M )
- 也就是未来会存在一些每天花费大约一百-几百到 1-2 千元 token 成本,生产效率约等于无限制使用现在的 claude Fable5 模型进行各类工作(很可能是多模态工作)的这么一些人。
所以未来编程行业会是什么样呢?未来各行各业会是什么样呢?大厂工作的人我感觉未来 5 年应该都能做到上述推断的程度,大厂的生产力会前所未有的蓬勃,个人工作者市场应该会完全消失。其他所有从事文创、生产类工作的工作者,比如在起点写小说的,可能会有 fable5 帮忙连续不断地 24 小时推演。