惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园 - Franky
云风的 BLOG
云风的 BLOG
美团技术团队
The GitHub Blog
The GitHub Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
T
The Blog of Author Tim Ferriss
MongoDB | Blog
MongoDB | Blog
H
Hacker News: Front Page
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Attack and Defense Labs
Attack and Defense Labs
M
MIT News - Artificial intelligence
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
NISL@THU
NISL@THU
阮一峰的网络日志
阮一峰的网络日志
PCI Perspectives
PCI Perspectives
K
Kaspersky official blog
N
Netflix TechBlog - Medium
T
Troy Hunt's Blog
G
GRAHAM CLULEY
Stack Overflow Blog
Stack Overflow Blog
罗磊的独立博客
H
Help Net Security
Hacker News: Ask HN
Hacker News: Ask HN
Know Your Adversary
Know Your Adversary
The Hacker News
The Hacker News
Spread Privacy
Spread Privacy
爱范儿
爱范儿
博客园_首页
人人都是产品经理
人人都是产品经理
Last Week in AI
Last Week in AI
Microsoft Security Blog
Microsoft Security Blog
J
Java Code Geeks
N
News | PayPal Newsroom
S
Schneier on Security
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
L
Lohrmann on Cybersecurity
N
News and Events Feed by Topic
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
www.infosecurity-magazine.com
www.infosecurity-magazine.com
T
Threat Research - Cisco Blogs
U
Unit 42
V
Vulnerabilities – Threatpost
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
T
Threatpost
B
Blog RSS Feed
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Vercel News
Vercel News
月光博客
月光博客
A
Arctic Wolf

InfoQ - 促进软件开发领域知识与创新的传播

Meta 收购 Manus 这事儿泡汤了 5.5万 Star 开源项目 Ghostty 被迫出走,GitHub 正在终结一代技术人的乌托邦 Slack 长时运行多智能体系统的上下文管理方案 从 T+1 到分钟级:金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台 谷歌云推出 Agents CLI,简化 AI 智能体开发全流程 Claude官方击穿高薪、高学历的安全防线!Anthropic点名10大高危职业,但有群人暂时稳了 亚马逊云科技终止 WorkMail 服务,并将 App Runner 转入维护模式 OPPO小布记忆:全模态碎片化内容的理解与智能整理实践|AICon上海 模力工场038周AI应用周榜:工具在消失,工作流在出现 Akamai CEO Tom Leighton:Agent 时代来临,云基础设施正从“中心化”转向“分布式边缘” 日均数百亿入库背后:从“人肉调度”到K8s弹性架构,度小满金融基于OceanBase重构入库架构实践 百度文库网盘发布GenFlow 4.0:月活用户超1亿,要把网盘变成全端AI工作台 Altman 投的 Agent 终端 Warp 开源了!斩获3.5万star 哪些客户需要拒, 敢让龙虾决定吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从开发到生产:为什么越来越多的机器学习团队纷纷迁移到 Snowflake | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 探索多智能体工作流:LangGraph Snowflake Cortex AI | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 腾讯云分布式缓存数据库:AI Agent - 从提示词工程到 Harness 工程 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 基于 Streamlit 为 CSV 数据构建分析智能体 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 AI 智能体:告别文档缺漏 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 构建 AI 驱动的数据管道:深度探讨 Snowflake Openflow 与非结构化数据 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 云端太贵、本地不够聪明,英特尔押注“端云混合AI”:智能体PC会替人完成工作 不到10%的存储投入,可能拖垮90%的GPU投资!IBM把AI Agent塞进存储系统,算清企业最容易忽略的一笔账 Snowpark 上手实战 | BUILD 2025_大数据_王玮_InfoQ精选视频 ClickHouse + Langfuse,构建 Agent 可观测基石 腾讯云分布式缓存数据库:Cluster Proxy 共享连接架构深度解析 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 AI 写代码太烧钱了:Copilot、Claude 一起涨价,不如把程序员请回来? 英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,全新AI工作站来了 腾讯云分布式缓存数据库:从 Redis 到 Valkey - 开源社区如何快速创新 | 腾讯云数据库 DBTalk_腾讯_凌敏_InfoQ精选视频 印奇这次要“从0重做”智驾模型!首谈阶跃和千里双公司布局:中国AI商业闭环要靠车跑出来 从Cursor返聘归来,90后华裔女高管带Claude开启日更模式:token成本比工程师工资低多了! 从 Coding 到 Agent:QCon 北京 2026 全景复盘,优秀出品人 & 明星讲师名单揭晓 全链路支撑大模型国产化“Day 0适配”,商汤大装置构建全栈能力底座 凌晨,OpenAI 与亚马逊云科技史上最大联合发布来了 HashiCorp Vault 2.0 发布:引入新身份联邦机制,迈入 IBM 生命周期体系 Yelp 实现超 1,000 个 Cassandra 节点零停机升级 写了 17 年开源代码,我为什么认为 Coding Agents 堆功能是在瞎折腾? 基于 Apache Camel 编排智能体与多模态 AI 管道 面向智能体与人类用户的AI记忆系统:架构设计与核心场景实践|AICon上海 Anthropic 推出 Managed Agents,简化 AI 代理部署流程 阿里HappyHorse开启灰测,720P视频生成低至0.44元/秒 讯飞联合清华团队押注量子AI:不看营收、不设KPI,一群“无人区”科学家,抢夺下代AI算力入口 小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek Cortex Code 入门指南:面向数据工程师的实践路径 | 技术实践 openJiuwen社区首发Team Skills,定义Coordination Engineering新范式 用 Snowflake Cortex Agents 释放结构化数据的最大价值 | 技术实践 Grafana 利用 Kafka 对 Loki 进行了架构重构,并发布了一款命令行工具,旨在将可观测性引入编码代理 ClickHouse重构全文索引:对象存储上跑出高性能 Full-Text Search 可观测性和遥测技术如何提升软件工程实践 Dropbox 与 GitHub 合作,将单体库大小从 87GB 缩减至 20GB Agent 的下一站:基于长期记忆系统 EverOS 的自我演进|AICon上海 同一赛道,四种收费:Agent 控制层(Harness)开始分裂 Cloudflare Sandboxes 正式发布,为 AI 代理提供持久化隔离环境 Agent 的“记忆断片”困局,该怎么破?_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选视频 数据分析师如何快速建立在 AI 时代最值钱的能力:一份可落地的行动路线图 摩尔线程最新财报:研发占比超86%,万卡级大规模智算集群落地 当云区域失效:地缘动荡环境下的高可用重构 Slack 重构通知系统,设置参与度提升 5 倍 智能体工程的隐性技术债务 “我把所有模型都换成了DeepSeek V4”:月账单将降 90%,效果还更好 阿里云智能集团高级技术专家刘少伟已确认出席AICon上海站,并分享如何构建企业 Agent 的自动化行动架构 构建生产就绪的 tRPC API:Apollo Federation 的 TypeScript 替代方案 Anthropic推出面向Claude Code的基于智能体的代码审查功能 北京车展直击:斑马智能甩出车载Agent短剧,比亚迪率先落地,AI让智能座舱又热起来了 Snowflake 作为智能体运行时:从静态管道迈向自主数据系统 | 技术实践 Snowflake 上的本体体系:基于 Cortex Code 能力实现从架构到部署 | 技术实践 Cloudflare 公布 MCP 架构方案,应对企业面临的安全与治理风险 复杂的项目管理怎么做到「AI 友好」?飞书项目用「开放」给出答案 Snowflake Cortex Code 的规范驱动开发:将 SDLC 方法论引入 AI 辅助工作流 | 技术实践 Copilot 不让注册了:从“随便用”到“全面限”,agent 把原有订价模型顶穿了 当互联网用AI卷效率时,这家公司先问了一连串“能不能” Meta 开始记录员工每一次点击:AI 要接管工作,先监控会工作的人 Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱 智源FlagOS完成DeepSeek-V4-Flash在八款芯片Day0适配,实现三重技术突破 DeepSeek V4 重磅开源!首次打通华为Ascend,也没丢掉英伟达,百万上下文夺回国产模型话语权 李志飞的“新实验”:当超级个体撞上真实组织 GPT-5.5 登顶时刻,Anthropic 亲口承认 Claude 变笨了!网友群嘲:太敷衍 那些没空写的小需求,龙虾真能做吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 从 Pandas 到生产:使用任意 IDE 进行可扩展的 ML 数据管道与分布式处理 | BUILD 2025_AI&大模型_王玮_InfoQ精选视频 pnpm 11 候选版本发布,带来 ESM 分发、供应链默认设置以及新的存储格式 银行业PDF表格提取方案重构:基于Java的分层方案 GPT-5.5 赢了 Opus 4.7 和 Mythos?奥特曼晒黄仁勋内部信:英伟达全员用上 Codex! Cloudflare 推出 Think:一款面向 AI 代理的持久化运行时 1850亿美元天价支出、75%代码由AI生成!谷歌正式宣告:全面转向智能体工作流 xAI落后太多,马斯克“开大”重金求购Cursor,100亿美金“分手费”都敢签! Pulumi 新增对 Bun 运行时的全面支持 姚顺雨腾讯模型首秀!不卷参数只做 “听话打工人”,Hy3 preview登场 | 附实测 老板让你“忽悠”投资人,你敢发给龙虾吗?_AI&大模型_InfoQ 中文站_InfoQ精选视频 Gemini CLI 引入子代理机制,实现任务委派与并行代理工作流 清华系团队星工聚将完成数千万天使轮融资,轮式机器人拿下头部制造企业亿级大单 Pretext.js 绕过 DOM 布局重排,实现 120 FPS 的高级交互体验 靠“AI 云”爆红的 Vercel,栽在一个第三方AI工具手里!IPO前夕遭黑,200万美元赎金谈崩? 高能研讨会|端侧 AI 正在重写实时感知效率上限_AI&大模型_王玮_InfoQ精选视频 2050大会看这篇就够了|报名、交通食宿指引大全 Java 近期资讯:OpenJDK JEP、Jakarta EE 12、Spring Framework、Micrometer、Camel、JBang 金融智能的架构编排:基于 Snowflake Cortex Agents 实现结构化与非结构化数据统一分析 | 技术实践 在AK大神爆火的任务里,摸清国产AI真实水平 百灵Ling-2.6-flash 正式发布:高 Token 效率,以 1/10 消耗实现 SOTA 级 Agent 能力 当 PM 懂AI,当技术懂产品:AI 时代产品力的双向进化|PM x AI产品力领航者大会即将开幕 为 AI 智能体设计记忆机制:揭秘 LinkedIn 的认知记忆智能体 获奖名单公布|2026主题征文第一期|分享你最有价值的龙虾场景与核心 Skill_热门活动_InfoQ写作社区官方_InfoQ写作社区
腾讯撑场、60亿豪赌,“GPU四小龙”最后一龙刚刚过会
李冬梅 · 2026-06-16 · via InfoQ - 促进软件开发领域知识与创新的传播

GPU“四小龙”最后一龙刚刚过会

又一家国产 AI 芯片公司走到科创板 IPO 审核关键节点。

今天下午,上交所官网发布审核结果,云端 AI 算力厂商燧原科技科创板 IPO 申请获上市委会议审议通过。

回溯其上市进程,公司 1 月 22 日正式拿到科创板受理函,经过两轮监管问询后顺利上会。

作为国产 GPU 第一梯队的“四小龙”之一,燧原科技此次过会意义重大,此前摩尔线程、沐曦股份登陆科创板,壁仞科技赴港上市,待燧原科技完成挂牌,四家国产算力龙头将完整集结资本市场。

燧原科技成立于 2018 年 3 月。招股书显示,公司成立 8 年来,自研迭代了四代架构、5 款云端 AI 芯片,形成了 AI 芯片、AI 加速卡及模组、智算系统及集群,以及 AI 计算及编程软件平台在内的产品体系。

截图来源:燧原科技招股书

与市场上更常被拿来对标英伟达 GPU 生态的通用 GPU 路线不同,燧原科技选择的是 DSA 架构路线。

两种路线具体区别是啥?

简单来说,通用 GPU 强调更强的通用并行计算能力,而 DSA 更偏向针对特定计算负载进行架构优化。

对于燧原科技而言,其技术押注点并不是复刻 CUDA 生态,而是在云端 AI 训练和推理场景中,以自研指令集、自研计算单元、自研互联技术和自研软件栈构建一套独立体系。

它面向得是国内大模型训练、推理和智算中心建设带来的国产替代需求。而这条路上的阻碍也一目了然:英伟达长期建立的硬件、软件、开发者和客户迁移成本壁垒。

不跟 CUDA,走 DSA 架构和自研软件栈

在国产 AI 芯片公司中,燧原科技的路线较有辨识度。

招股书将国内云端 AI 芯片厂商大体分为两类:一类是以华为海思、寒武纪、燧原科技等为代表的 DSA 架构厂商;另一类是以摩尔线程、沐曦股份、天数智芯、壁仞科技等为代表的通用 GPU 架构厂商。

燧原科技的核心硬件架构包括 GCU-CARE 加速计算单元和 GCU-LARE 片间高速互连技术。

按照招股书表述,GCU-CARE 对标的是英伟达 Tensor Core 加速计算单元,GCU-LARE 则对标英伟达 NVLink 卡间互联技术。

软件层面,公司没有跟随 CUDA 生态,而是自研了包括驱动程序、编译语言与编译器、算子库、工具链在内的全栈 AI 计算及编程软件平台“驭算 TopsRider”。

这条路线的优势在于,燧原科技可以围绕 AI 训练和推理的实际负载做软硬件协同优化,特别是在推理侧,行业对 CUDA 生态的依赖相对训练侧更低,成本、能效和部署效率的重要性更高。

招股书也提到,随着 AI 推理市场增长,DSA 架构有望在特定场景下体现更高性价比。

但这条路线的难点同样明确:软件生态迁移、模型适配、算子覆盖、客户验证周期,都会成为商业化落地的门槛。AI 芯片不是只靠硬件参数取胜的生意,能否让客户的模型、框架和业务稳定跑起来,往往比单芯片峰值性能更关键。

市场最终还是要看产品说话。

在产品策略上,燧原科技已经形成了较清晰的代际路线。

截图来源:燧原科技招股书

2019 年,公司推出第一代邃思 1.0 架构,对应云燧 T1x 训练系列和云燧 i1x 推理系列产品;

2021 年,公司推出第二代邃思 2.0 架构,对应云燧 T2x 训练系列;同年推出邃思 2.5 架构,对应云燧 i2x 推理系列;

2024 年,公司推出第三代邃思 320 架构,对应云燧 S60 推理卡。该产品主要面向大模型推理场景;

2025 年,公司推出第四代邃思 400 架构,对应云燧 L600 训推一体模组;

招股书显示,邃思 400 支持 FP8 低精度运算,并面向超万卡集群扩展需求。云燧 L600 采用 OAM 模组形态,支持高密度、高互联的 AI 服务器部署。

在芯片和加速卡之外,燧原科技也在向系统和集群层推进。其智算系统品牌为云燧智算机 Cloud Blazer POD,通常由 4 至 8 台 AI 专用服务器和多台网络交换机组成,单个 POD 一般集成 32 至 64 张 AI 加速卡及模组。更大规模的智算集群,则由多个 POD、CPU 通用服务器、高速网络设备、独立存储服务器和公司自研系统软件共同组成。

不过,从收入结构看,燧原科技当前最主要的收入来源仍然是 AI 加速卡及模组。

2025 年,公司主营业务收入为 9.86 亿元,其中 AI 加速卡及模组收入 8.56 亿元,占比 86.83%;智算系统及集群收入 1.28 亿元,占比 13.00%;IP 授权及其他收入 164.20 万元,占比 0.17%。

截图来源:燧原科技招股书

这说明,虽然公司已经具备从单卡、模组到 POD 和集群的产品形态,但现阶段商业化重心仍在 AI 加速卡及模组交付。系统和集群业务能否持续放量,仍取决于大客户项目节奏和后续国产智算中心建设需求。

燧原科技能在成立数年内完成多代芯片架构迭代,并将产品推向云端 AI 算力市场,与其创始团队长期积累的芯片设计、工程管理和产业化经验密切相关。

芯片老兵带队、腾讯“撑腰”,资本追着投

燧原科技的共同实际控制人为 ZHAO LIDONG 和张亚林。

招股书显示,ZHAO LIDONG 出生于 1966 年,拥有清华大学电子工程学士学位、犹他州立大学电子与计算机工程硕士学位,拥有 30 余年芯片设计及管理经验。他曾在 S3、Juniper Networks、AMD 等公司任职,并曾参与 AMD 中国研发中心的建立。2018 年 3 月,他共同创立燧原科技,目前担任公司董事长、CEO 及董事会秘书。

张亚林出生于 1978 年,拥有复旦大学电子工程和信息系统专业学士学位,拥有 25 年芯片设计及管理经验。

招股书披露,他曾在 AMD 任资深芯片研发经理、中国研发中心芯片技术总监,主导过 Xbox-One 主芯片、小霸王 Z+芯片等芯片设计项目。

2018 年 3 月,他与 ZHAO LIDONG 共同创立燧原科技,目前担任公司董事、总经理、COO。

从团队构成看,燧原科技的核心技术人员同样具有较强的芯片产业背景。

招股书披露,公司核心技术人员包括柴菁、罗巍和陈松涛。其中,柴菁曾在 AMD 任资深芯片研发经理,加入燧原科技后负责硬件芯片部门,并参与公司四代架构、5 款云端 AI 芯片从架构设计到量产的研发过程;罗巍曾在英伟达上海任 CUDA 测试开发和质量保证高级经理,加入燧原科技后负责软件研发体系,主导驭算 TopsRider 软件栈从零到一建设;陈松涛曾在 Teradyne、Avago、Marvell 等公司任职,加入燧原科技后负责产品及系统工程体系。

截图来源:燧原科技招股书

从创始团队阵容和核心人员构成来看,燧原科技从成立之初就不是单纯“做一颗芯片”,是试图同时补齐芯片架构、板卡模组、系统集群和软件栈能力。

这种路线无疑要投入巨大的研发成本。

招股书披露,2023 ~ 2025 年,公司累计研发投入 36.76 亿元,累计营业收入 20.14 亿元,最近三年累计研发投入占最近三年累计营业收入比例为 182.55%。

截至 2025 年末,公司员工人数为 838 人,其中研发人员 643 人,研发人员占比 76.73%。

由于巨大的研发投入和较长的回报周期,燧原科技虽然收入增长较快,但仍处于持续亏损阶段。

2023 年至 2025 年,公司营业收入分别为 3.01 亿元、7.22 亿元和 9.90 亿元;净亏损分别为 16.65 亿元、15.10 亿元和 11.64 亿元。同期,公司研发费用分别为 12.29 亿元、13.12 亿元和 11.35 亿元,研发费用占营业收入比例分别为 408.01%、181.66%和 114.63%。

截图来源:燧原科技招股书

2026 年一季度,公司实现营业收入 2.87 亿元,同比增长 1474.85%;归属于母公司股东的净亏损为 4.44 亿元,亏损同比扩大。

招股书解释称,2026 年一季度,公司产品进一步在下游客户端放量,但由于公司保持较高研发强度,同时预收客户款项预提的利息费用以及产生的税金及附加,也对当期利润产生影响。

截图来源:燧原科技招股书

也正因为如此,燧原科技过去几年持续获得资本加码。

从披露数据看,仅 2023 年至 2024 年,燧原科技就完成了多轮融资。

2023 年 9 月,燧原科技完成债转股及 D 轮融资。腾讯科技、国方金浦等投资者以合计 7.67 亿元前期可转债借款和 8.90 亿元货币资金认缴新增注册资本。其中,D 轮货币资金增资参考投前估值约 141 亿元;前述可转债投资者则按照约 123.43 亿元投前估值或下一轮融资投前估值孰低值转股。

同年 12 月,公司完成 D+轮融资。淮安铁荣、云创智算、安徽中安、浙江基金等 8 家投资者以约 6.80 亿元货币资金认购公司新增股本,本轮融资投前估值约 159 亿元。

进入 2024 年,资本继续加码。2024 年 6 月,燧原科技完成 D++ 轮融资,腾讯科技等 12 家投资者以约 7.53 亿元货币资金认购公司新增股本,本轮融资投前估值约 166 亿元。

其中,腾讯科技出资 3 亿元,是该轮融资中单笔出资金额最高的投资方。

2024 年 12 月,燧原科技又完成 E 轮融资。上海产投、腾讯科技等 36 名投资者以约 27.20 亿元货币资金认购公司新增股本,本轮增资投前估值约 175 亿元。其中,上海产投和腾讯科技分别出资 3 亿元,国投聚力出资 2 亿元,扬州国珺出资约 1.98 亿元,武岳峰三期出资 1.85 亿元。

连续融资背后,一方面是 AI 芯片行业本身的资本密集属性;另一方面,也反映出资本对国产 AI 算力替代窗口的押注。

这里边有一个很值得关注的信息:腾讯不仅是燧原科技的重要股东,也同时是公司的重要客户。

招股书显示,截至招股说明书签署日,腾讯科技及其一致行动人苏州湃益合计持有燧原科技 20.2580%的股份,是公司第一大股东;而 ZHAO LIDONG 和张亚林通过直接持股及员工持股平台合计控制公司 28.1357%的表决权,公司不存在控股股东,股权结构较为分散。

2025 年,公司主要采用直销模式,直销收入占主营业务收入比例达到 98.74%。

从前五大客户情况看,腾讯科技(深圳)有限公司对应销售金额为 7.68 亿元,占比 74.90%;成都高新电子信息产业有限公司对应销售金额为 1.45 亿元,占比 14.15%;客户 A、客户 B、客户 C 分别贡献 5505.93 万元、1340.98 万元和 1195.26 万元。前五大客户合计占比达到 96.89%。

招股书进一步解释,公司客户集中度较高,一方面与智算系统及集群业务中单个大额合同有关,另一方面与互联网终端客户需求集中有关。除了直接向腾讯销售,公司还存在 AVAP 模式,即按照与互联网客户商定的价格,将 AI 加速卡或模组销售给该互联网客户指定的服务器厂商。因此,部分服务器厂商采购背后,实际终端需求也可能来自互联网客户。

此次 IPO,燧原科技拟募集资金 60 亿元,继续投向第五代 AI 芯片系列产品研发及产业化项目、第六代 AI 芯片系列产品研发及产业化项目,以及先进人工智能软硬件协同创新项目。

换言之,从过去几轮融资到此次冲刺科创板,燧原科技融资主线并没有改变:继续用资本换研发周期,用研发迭代换产品放量,再通过大客户场景验证,争取在国产 AI 算力市场中站稳位置。

国产 AI 算力窗口打开,但英伟达仍是最大参照物

与已顺利完成 IPO 的“国产 GPU 四小龙”前三位一样,燧原科技同样赶上了国产 AI 芯片公司无法忽视的战略窗口期。

过去几年,大模型训练与推理需求快速增长,尤其是近一年来,以“龙虾类 Agent”为代表的新型应用大幅推高了 Token 消耗,算力已从互联网大厂的技术储备,转变为云厂商、运营商、地方智算中心及行业客户共同投入的基础设施。

随着 AI 应用从模型训练逐步走向规模化部署,推理算力需求持续放大,这也为国产 AI 芯片公司提供了新的切入机会。

招股书援引灼识咨询数据称,2024 年全球 AI 加速卡市场规模约为 1190.28 亿美元,预计 2028 年将增长至 5257.70 亿美元;中国 AI 加速卡市场规模则从 2020 年的 122.54 亿元增长至 2024 年的 2164.77 亿元,预计 2028 年将达到 11076.46 亿元。

截图来源:燧原科技招股书

不过,比起总量的扩张,市场内部的结构性变化更值得玩味。

过去,外界谈论 AI 算力,几乎等同于谈论大模型训练。但训练终究有阶段性,而推理需求却是伴随着应用落地持续存在的。

数据显示,到 2028 年,中国推理 AI 加速卡的市场规模预计将达到 8085.82 亿元,占整体市场的七成以上。

这一趋势对燧原科技这类采用 DSA(专用领域架构)的厂商而言,意义尤为现实。在训练市场,英伟达凭借 CUDA 生态构筑了极深的护城河,尤其是在软件适配和集群稳定性上,后来者很难在短期内正面突破。相比之下,推理场景虽然同样看重可靠性,但客户对成本、能效比和部署密度的敏感度更高。在那些模型相对固定、应用场景明确的行业里,只要国产芯片能拿出经得起验证的性价比,就有机会撬开客户的采购大门。

不过,这并不意味着国产 AI 芯片已经站到了与英伟达同等竞争的位置。

招股书披露,2025 年中国 AI 加速卡总出货量约为 400 万张,其中英伟达出货量约 220 万张,占比约 55%。同期,燧原科技销售 AI 加速卡及模组 6.63 万张,按照出货量口径测算,中国市场份额约为 1.7%。

这组数据很直观地说明了国产 AI 芯片公司的处境:需求窗口确实打开了,但市场主导者仍然是英伟达。国产厂商目前更多是在部分客户、部分场景、部分项目中完成验证和替代,距离真正的大规模普及,还有产品迭代、软件生态、客户迁移和集群稳定性等多重门槛需要跨过。

因此,对燧原科技来说,IPO 前后最核心的问题并不是“能不能做出国产 AI 芯片”。从招股书披露的产品迭代和销售情况看,公司已经完成了从芯片、加速卡到智算系统的商业化落地。更关键的问题在于,它能否让这些产品在大客户真实业务中长期稳定运行,并持续降低客户从英伟达生态迁移到国产 AI 算力平台的成本。

换句话说,国产 AI 算力的机会已经出现,但真正的考验才刚刚开始。对于燧原科技而言,市场给出的不是一张现成门票,而是一场关于产品可靠性、软件生态和规模化交付能力的长期验证。