























隨著半導體產業敘事轉向 AI 推理,記憶體與儲存正成為供應鏈中最大的瓶頸。市場也擔憂 HBM、DRAM、NAND SSD 這一輪漲勢,是又一次固定的牛熊週期,還是真的出現了突破性改變?
半導體架構分析人士 fin 對此建立一套三條件框架,分別替 HBM、DRAM、NAND SSD 打分數,從客製化程度、結構性需求成長、技術迭代速度三個維度逐一檢視,並進一步拆解市場關注的兩大變數:中國長鑫存儲 CXMT 擴產的實際威脅,以及 GPU 架構是否會因為 Transformer 與 KV Cache 被淘汰而動搖 HBM 需求根基。
半導體產業存在週期性,但記憶體的週期與波動性又特別劇烈,外界普遍解釋是因為記憶體具有「商品」特性:「產品無差異化、容易打價格戰、又能囤貨。」
然而,fin 認為這個解釋只說對一半。商品屬性本身並不會「製造」週期性,只是一個振幅放大器。真正原因在於記憶體的供給擴產週期太長,長到足以與需求週期脫節。建一座晶圓廠需要三年時間、數百億美元投資,而且決策一旦下達就不可逆。與此同時,需求端卻充滿不確定性,每當出現雲端服務、智慧型手機、疫情線上需求促成新一波成長動能,各廠就會大加碼產能,但通常兩年後成長放緩、供給追上甚至超過需求、價格崩跌,整個產業隨即陷入虧損循環。
理解了週期性的真正根源,下一個問題是:「HBM、DRAM、NAND SSD 這次有沒有不一樣?」
要判斷一項記憶體產品能否部分或大幅擺脫傳統週期性,fin 提出以下三項條件:
只要滿足其中一項,就能部分擺脫傳統週期性;滿足兩到三項,就能擺脫大部分週期性,轉化為「漲多跌少」而非「漲多跌深」的傳統週期。
根據這套標準,HBM、DRAM、NAND SSD 的分數各有優劣。
從架構上來看,HBM 上層疊起的十幾層 DRAM 晶粒完全遵循 JEDEC 標準,真正客製化的部分僅集中在下層的封裝與基底晶片(base die),但隨著 HBM4 之後的客製化程度有所提升,將加大客戶簽訂長期合約的意願。
再來從三星案例來看,當三星 HBM3E 未能通過輝達驗證,市佔率從約 60% 一路跌到 17% 時,這批產能並沒有變成死庫存,而是直接轉供 Google TPU 與 AMD,代表產能本質上仍可自由轉移。
既能鎖定長期合約但產能又能自由轉移,因此這一項只能算半分。
作為 HBM 能夠大幅擺脫週期性的核心理由,其底層邏輯可以濃縮成一個公式:代幣輸出量 (token throughput) = HBM 容量 × HBM 頻寬,而且每一代都呈倍數成長。
(打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲?)
首先在需求端,每張 GPU 的 HBM 容量年成長率超過 40%,而 DRAM 供給端僅靠 14% 的晶圓量成長與 9% 的密度提升支撐,供給顯然難以追上需求。
接著,在注意力機制(attention)運算階段,KV Cache 對頻寬與容量的需求極高,讓 HBM 取得近乎獨佔的地位。即使 HBM 價格上漲三到五倍,把錢花在 HBM 上而非SRAM、HBF、CXL、PIM 等替代路徑,所換取到的邊際代幣輸出量,仍遠比花在其他硬體上更划算。
基於其他替代方案目前都無法在 KV Cache 與注意力運算這個核心戰場上與 HBM 正面競爭,fin 預期 HBM 的領先地位至少能維持五年以上。
傳統 DDR 從 DDR3 走到 DDR5 花了超過十五年,但 HBM 基本上是兩年一代,迭代速度遠超傳統記憶體,近期甚至出現加速趨勢。隨著 HBM 每兩年升級一次,NVIDIA GPU 的速度也呈現近乎指數型成長的軌跡,從每秒 2TB 到 22TB 一路向上,與推理代幣輸出量呈現完美的線性關係。

隨著 HBM3 等舊產品折舊極快、囤貨價值快速消失,HBM 廠商的競爭邏輯也出現改變:從過去比拼當前產能與市佔率的「數量競爭」,轉向比拼技術穩定性與下一代在輝達平台上驗證份額的「品質競爭」。
除了三大條件,HBM 還有一項隱藏優勢:DRAM 密度微縮速度正在快速放緩。約在 2000 年前後,每片晶圓的 DRAM 位元密度年成長可達 45%,十年前降到 20%,如今只剩 9%。這意味著過去靠技術提升就能讓位元量年增 20% 到 30%,現在更需要實際新建晶圓廠與無塵室才能擴產。
HBM 本身又再加重這個難題:HBM3E 需要約三倍的 DRAM 晶圓量才能產出等量位元,HBM4 因堆疊密度提高,進一步上升到四倍。換算下來,每單位 DRAM 晶圓所能產出的 HBM 位元數正在持續下滑,等同於對供給端形成自然的緊縮效果。
把 HBM 的三項打分加總,得出兩項半的成績,意味著它正從「傳統週期性」轉化為「成長型週期性」。兩者的差別在於:
只要代幣需求持續呈指數成長,需求就會比傳統週期更可預測,且一旦價格下跌,客戶會立刻傾向增加 HBM 容量以提升代幣輸出量,反而刺激需求回補。再加上 HBM 輕度客製化帶來的長期合約綁定,fin 預期這一輪週期會特別長。
即使 HBM 目前體質優異,市場仍有一個疑慮:這條依賴 HBM 指數型成長的 GPU 架構演進路徑,有沒有可能因為模型架構革命而中斷?
問題的本質可以回去看先前提及的核心公式,其中 HBM 容量成長的根源正是 KV Cache 的成長。換句話說,如果 KV Cache 在架構上不復存在,HBM 容量指數成長的邏輯就會被連根拔起。因此真正該問的問題其實是:以 Transformer 為代表的注意力機制,以及由此衍生的 KV Cache 機制,會不會被未來的架構淘汰?
從歷史規律觀察,每一次 AI 模型架構革命中,真正被保留下來的,往往是具備某種數學普適性的原始運算(primitive operations)。最具代表性的例子是 FFN(前饋網路),這是 2012 年深度學習時代的產物,卻一路存活到今天的大型語言模型中,至今仍佔據模型參數相當大的比例。
注意力機制很可能也屬於這類會被保留的原始運算,因為它解決的是同樣根本的問題:讓序列中任意兩個位置能按需建立動態連結。一旦這種能力被驗證有效,就很難被完全拋棄。即使未來架構從純 Transformer 演進到混合架構,甚至演進到世界模型(world models),注意力層高機率仍會存在,KV Cache 仍會被需要,而 HBM 仍將是推理運算的核心之一。
在 DRAM 方面,首先它沒有客製化可言,三項條件中第一項可以直接忽略。但在強力且持續性的成長這一項,隨著代理型 AI CPU 在 2025 年底開始釋放潛力,依附在 CPU 上的 DRAM 需求,正成為 DRAM 指數成長的全新動能。這個成長邏輯可以拆成兩層來看。

推升 CPU TAM 快速成長的邏輯主要有四點:
這四個因素帶動 CPU TAM 預測在短時間內被連續大幅上修:兩個季度前,AMD 財報預估 2030 年 CPU TAM 為 600 億美元;兩個月前,AMD 與 ARM 將預測翻倍上修至 1,200 億美元;一個月前,輝達再度翻倍上修到 2,000 億;上週,Bernstein 進一步將 2030 年 CPU TAM 指引上調到 2,230 億美元。市場普遍認為,這個數字未來被上修到 4,000 億美元基本上沒有太大疑問。
驅動這一層成長的核心原因在於,AI 代理本質上是有狀態且長時間運行的程式,而不是傳統無狀態的請求與回應模式。傳統網頁與 SaaS 服務在請求處理完畢後,記憶體會立刻被回收;但一個代理任務可能運行一分鐘到一小時,期間訊息歷史、系統提示詞、工作記憶、長期記憶與工具調用結果緩衝區都會持續駐留在 DRAM 中,且因為有狀態性與沙箱隔離需求,這部分記憶體佔用在技術上很難壓縮。
與此同時,情境視窗(context window)長度正呈指數型成長,從 32K 一路推進到 256K、甚至 1M,未來還會持續拉長,每個活躍會話駐留的訊息量也隨之線性膨脹。
fin 將兩層相乘:
兩個獨立變數相乘之後,伺服器端 DRAM 需求的成長將是指數級的。即使保守估計 2030 年 CPU TAM 為 3000 億美元,每核心 50 美元、16GB 配置,增量至少達到 96EB,相較今年全球 DRAM 總產出僅 47EB、明年也僅約 60EB,仍具有一定的缺口規模。
回到三條件框架,第三項技術迭代速度也出現變化。過去 DRAM 的技術迭代高度依賴消費電子市場,DDR 規格的進步對效能助益有限,因此新一代產品推出時市場反應冷淡,大家寧可等價格下跌再採用。但在可預見的未來,基於矽基消費型(CPU 伺服器)DRAM 用量將遠超碳基消費型(傳統消費電子)DRAM,加上端側 AI 對 DDR 速度的需求同步上升,速度升級的邊際效用大幅提高,DDR6 與 LPDDR6 的迭代節奏明顯加快,市場對新一代產品的採用態度也從觀望轉為搶先導入。
此外,DDR 的供給還要被 HBM 額外抽稅。由於 HBM3E 需要約三倍、HBM4 需要約四倍的 DDR 晶圓量才能產出等量位元,每年約有 3% 到 5% 的 DDR 位元成長被這個「HBM 位元稅」直接吃掉。整體計算下來,未來 DRAM 位元量大致能以每年 24% 成長(14% 來自晶圓量成長、9% 來自密度提升),但扣除 HBM 位元稅後,傳統商品型 DDR 實際年位元成長僅剩約 20%。
市場高度關注的另一個變數,是記憶體大廠長鑫存儲(CXMT)近年來的快速擴產,擔心其「恣意擴產」會將整個 DRAM 市場拖回傳統週期性的泥沼。
從產能數字來看,CXMT 確實擴張迅速:2025 年月產能約 20 萬片,2026 年北京廠加上新產線最高可貢獻到 32 萬至 35 萬片。在建中的上海廠分兩期推進,合計 2027 年將達到 42 萬片月產能、2028 年達到 50 萬片。
但關鍵在於,CXMT 的 DRAM 位元密度僅約三大廠的一半,因此其 50 萬片月產能,實際產出的 DRAM 位元量只相當於其他廠商的一半,計算時須「減半」處理。套用這個折扣之後,CXMT 對整體 DRAM 產業的衝擊明顯被稀釋:
從 2025 年底到 2028 年底,CXMT 對全產業 DRAM 位元產能年複合成長率(CAGR)的影響大約只有 1.5 個百分點,把整個產業的 CAGR 從約 12.7% 拉高到 14.2%。即使 CXMT 未來能維持目前的擴產節奏,到 2030 年其對全產業等效產能 CAGR 的影響也預期不到 3 個百分點,大致是把成長率從 20% 推升到 23%,並非外界想像的顛覆性衝擊。
(從長鑫存儲 CXMT IPO 文件看記憶體鬼故事:中國削價競爭會打擊市場嗎?)
另一個限制因素是,CXMT 受限於光刻機設備的缺乏,同時 DDR6 等先進規格的生產難度也較高。
即使是成長型週期,也需要解釋為什麼這一輪 DRAM 多頭格局預期能延續至少五年,且目前看不到結束的跡象。fin 認為主要支撐來自以下幾個層面。
傳統 DRAM 供給每年大致成長 20%,但需求端的成長速度遠高於此。以 2026 年 CPU TAM 600 億美元、每核心平均消耗 8GB DRAM、每核心 30 至 35 美元估算,需求約為 16EB;到 2030 年 CPU TAM 達 4,000 億美元、每核心平均消耗 16GB、每核心價格翻倍以上達 80 美元時,需求將達到 80EB,這部分 DRAM 需求的 CAGR 約為 50%,遠超目前市場的普遍估計。
需要注意的是,DRAM 短缺與 HBM 短缺的性質不同。HBM 直接綁定代幣輸出量,因此直接影響 GPU 的賺錢效率,需求剛性極強;而 DRAM 短缺主要影響代理工作流程的速度,例如 8GB 核心配置可能比 16GB 慢上 30%,部分低價值任務可以容忍延遲,因此需求剛性不如 GPU,但缺口擴大的方向同樣明確。
研究機構 SemiAnalysis 的估算顯示,今年 DRAM 缺口仍是個位數百分比,但明年將超過 10%,且這個缺口在 2030 年之前都沒有縮小的機會。
所謂需求儲存,指的是那些因記憶體價格過高而被暫時壓抑、一旦價格回落就會立刻釋放的潛在需求。常見的需求來源包括:
這些需求疊加起來形成極厚的緩衝層,使得即使供給階段性追上,價格也很難出現崩跌式下跌。
在上行週期中,DRAM 毛利率往往超越 HBM,甚至出現 HBM 漲價反被 DRAM 帶動的現象。今年新簽訂的 HBM4 合約價格,就是直接以當前 DRAM 價格乘以四倍的堆疊倍數計算。
一旦 DRAM 價格下跌、毛利率收斂,由於 HBM 長期合約的透明度能保鎖定利潤,HBM 反而會間接搶佔更多 DRAM 產能,同時也會刺激 GPU 廠商更有動機盡量提升 HBM 容量,間接為 DRAM 價格設下底線。
相較於 HBM 與 DRAM,NAND SSD 的成長動能相對較弱。今年的 SSD 短缺主要原因是主要廠商保持了良好的生產紀律,沒有大舉擴產。年度產能增量主要依靠技術改良,也就是增加 NAND 堆疊層數,而非大規模新建產能。
不過 NAND SSD 仍有三個值得關注的結構性成長來源:
NAND SSD 最大的優勢在於價格,fin 預期到 2027 年,其價格將僅為每 GB 0.8 美元,約為同期 DRAM 的四十分之一。這種價格優勢讓 NAND SSD 在多層快取架構中具備「萬能替補」的特質,結構性成長來源也相對廣泛:一旦 DRAM 或 HBM 漲價,市場自然會想辦法用更便宜的 SSD 分擔部分功能,以更低成本達到類似效果,因此理論上很難出現「DRAM/HBM 漲、SSD 卻不漲」的情境。
但 NAND SSD 能否真正擺脫傳統週期性,最終仍取決於廠商的生產紀律。市場上唯一可能打破這個默契的廠商是中國的長江存儲(YMTC),只要有一家廠商選擇大規模擴產,整個 NAND 產業就會重新陷入價格戰,遠比 DRAM 容易得多。
把三項打分標準套用在上面討論的三種記憶體產品上,可以得出清晰的成績排序:
整體而言,這一輪記憶體漲勢的根基,並非單純的供需錯配或炒作,而是建立在 AI 推理時代代幣輸出量需求結構性改變之上。只要 HBM 容量與頻寬持續被 GPU 架構演進綁定、代理型 AI CPU 對 DRAM 的需求缺口持續擴大、NAND SSD 廠商維持紀律不重演價格戰,這輪超級週期確實有條件走得比市場想像得更久,從「瘋漲暴跌」轉變為「漲多跌少」。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。