21世紀(jì)經(jīng)濟(jì)報道記者張賽男實習(xí)生曹麗萍
當(dāng)AI從“能對話”的大模型進(jìn)化到“能行動”的智能體(Agent),一場算力的底層革命正在悄然發(fā)生。由于智能體對長期記憶的剛需爆發(fā),存儲從幕后走向臺前,成為AI算力的“阿喀琉斯之踵”。
中信證券(600030)最新研報指出,在上述演進(jìn)中,驅(qū)動上下文需求從8K激增至1M tokens。以Llama-3-70B模型為例,單用戶FP16精度下的KV Cache顯存占用從5g(885556)B飆升至640GB以上。據(jù)Epoch AI數(shù)據(jù),最長上下文窗口約每年增長30x,KV Cache(鍵值緩存)顯存容量和上下文長度呈線性增長關(guān)系,遠(yuǎn)超硬件配置增速。
這場由智能體驅(qū)動的存儲革命,不僅重構(gòu)了數(shù)據(jù)中心的硬件配比,更在深刻改變產(chǎn)業(yè)鏈的價值分配。2025年以來,全球存儲市場迎來“超級周期(883436)”,DRAM與NAND Flash價格一年內(nèi)暴漲數(shù)倍,背后正是智能體對持久記憶、高速吞吐、海量容量的饑渴需求,將存儲行業(yè)推向了前所未有的繁榮期。
近日,21世紀(jì)經(jīng)濟(jì)報道記者采訪了多家存儲芯片(886042)廠家及上下游企業(yè),試圖還原這塊算力革命中的關(guān)鍵拼圖是如何影響產(chǎn)業(yè)鏈格局的。
智能體改寫存儲規(guī)則
如果說過去的AI算力圍繞“訓(xùn)練”展開,那么2025年以來的關(guān)鍵變量則轉(zhuǎn)向了“推理”。
“與過去幾年的重心不同,當(dāng)前AI發(fā)展正從訓(xùn)練轉(zhuǎn)向推理階段,具備決策與執(zhí)行能力的ai智能體(886099)正是該趨勢的重要反映?!苯眨瑑?nèi)存大廠華邦電子相關(guān)負(fù)責(zé)人接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時表示,“這對存儲芯片(886042)提出了包括帶寬、速度及功耗等多維度的全新要求?!?/p>
該人士說道:“不同于訓(xùn)練階段重視大規(guī)模并行處理,對延遲敏感度較低,AI推理更強(qiáng)調(diào)低延遲、低功耗和高效率,以適配端側(cè)AI的實時交互和成本控制需求。比如要確保ai應(yīng)用(886108)能夠在短時間內(nèi)快速響應(yīng)用戶,必須依托更高的帶寬和速度來進(jìn)行數(shù)據(jù)傳輸。此外,端側(cè)AI設(shè)備(如ai眼鏡(886085)、機(jī)器人等)普遍存在空間受限的特點,因此存儲芯片(886042)在功耗控制和尺寸體積層面都必須要精益求精,從而延長設(shè)備待機(jī)時間,并為產(chǎn)品輕量化設(shè)計提供靈活度?!?/p>
多個行業(yè)數(shù)據(jù)顯示,推理側(cè)的需求正在以指數(shù)級速度吞噬存儲產(chǎn)能。
據(jù)CFM數(shù)據(jù),AI服務(wù)器對存儲的需求呈幾何級增長:通用服務(wù)器通常配置DDR5512GB-1TB、SSD約4TB,而AI服務(wù)器DDR5配置達(dá)1.5TB-4TB,eSSD從4/8TB躍升至8/16TB,還需搭載HBM3E/HBM4。2026年,AI服務(wù)器在整體服務(wù)器出貨中占比將突破20%,部分公司甚至達(dá)到25%-30%。
這種爆發(fā)直接推高了存儲配置需求——2026年服務(wù)器DRAM應(yīng)用占比將超過50%,需求增速超過40%;Server NAND需求同比增長63%,HBM增長35%,SOCAMM更是暴漲150%。
CFM閃存市場總經(jīng)理邰煒在近日公開演講中談道,AI正在把存儲從BOM表里的成本項之一,變成AI競賽的戰(zhàn)略資源,從一個周期(883436)性的產(chǎn)品變成數(shù)字經(jīng)濟(jì)(885976)的核心競爭力。
他詳細(xì)解釋了KV Cache機(jī)制對大模型推理的重要性:為避免重復(fù)計算、減少推理時間,每一層、每個token的Key Value結(jié)果都需要存儲。但隨著大模型從短上下文向長上下文演進(jìn),加上高并發(fā)推理需求,KV Cache占用空間隨token數(shù)量和并發(fā)請求量線性暴漲。
數(shù)據(jù)直觀展示了這一驚人增長:單請求下,上下文從4K token增至128K token,KV Cache存儲空間直接增長32倍至64GB;若遇到100個并發(fā)請求,需求將達(dá)到TB級別。
這意味著,KV Cache把“存儲問題”從后臺資源變成了AI系統(tǒng)的前臺瓶頸,內(nèi)存的瓶頸在“推理階段”被系統(tǒng)性放大了。廠商重構(gòu)存儲“新基建”
面對智能體時代的需求重構(gòu),全球存儲產(chǎn)業(yè)鏈正在瘋狂擴(kuò)產(chǎn)。
國際巨頭方面,SK海力士宣布,計劃2030年前在韓國龍仁市投資21.6萬億韓元(約150.7億美元);美光擬在美國建設(shè)多座晶圓廠,并以18億美元收購臺灣力積電工廠。
據(jù)21世紀(jì)經(jīng)濟(jì)報道記者統(tǒng)計,國內(nèi)存儲產(chǎn)業(yè)鏈也開啟了擴(kuò)產(chǎn)計劃??傮w來看,存儲模組企業(yè)直接受益漲價,擴(kuò)產(chǎn)最為激進(jìn);封測企業(yè)承接擴(kuò)產(chǎn)需求,提升國產(chǎn)配套能力;芯片設(shè)計企業(yè)加速研發(fā)新品。
作為全球第二大獨立存儲器廠商、國內(nèi)存儲模組龍頭企業(yè),江波龍(301308)(301308.SZ)在2024年業(yè)績回升后,于2025年賺得盆滿缽滿,預(yù)計實現(xiàn)歸母凈利潤為12.5億元至15.5億元,同比增長150.66%至210.82%,創(chuàng)歷史新高(883911)。公司趁熱打鐵,擬定增募資37億元,用于面向AI領(lǐng)域的高端存儲器研發(fā)、半導(dǎo)體(881121)存儲主控芯片系列研發(fā)、半導(dǎo)體(881121)存儲高端封測建設(shè)等項目。
存儲大牛股德明利(001309)(001309.SZ)也在去年底拋出定增計劃,擬募資不超過32億元,用于固態(tài)硬盤(SSD)擴(kuò)產(chǎn)項目、內(nèi)存產(chǎn)品(DRAM)擴(kuò)產(chǎn)項目、德明利(001309)智能存儲管理及研發(fā)總部基地項目及補充流動資金。
今年3月,存儲龍頭佰維存儲(688525)(688525.SH)則下了一個超級訂單,震動市場。公司與海外存儲原廠簽訂15億美元(約103.67億元人民幣)長期采購合同,鎖定未來24個月存儲晶圓供應(yīng)。公司日前在互動平臺表示,子公司泰來科技(佰維惠州封測制造中心)是公司先進(jìn)封測及存儲器制造基地,公司正加緊該地產(chǎn)能擴(kuò)建,以滿足客戶的交付需求。
普冉股份(688766)(688766.SH)以并購方式快速實現(xiàn)規(guī)模擴(kuò)張。2025年以來,公司先后以9000萬元獲得諾亞長天20%股權(quán)、以1.44億元收購其31%股權(quán)。近日,又?jǐn)M以2.47億元收購剩余49%股權(quán),實現(xiàn)對SK海力士剝離的2D NAND企業(yè)SHM的全資控股,豐富產(chǎn)品線。
在封測環(huán)節(jié),龍頭也在擴(kuò)產(chǎn)。封測龍頭通富微電(002156)(002156.SZ)今年1月披露,擬定增募資44億元,其中8.88億元用于“存儲芯片(886042)封測產(chǎn)能提升項目”,建成后年新增產(chǎn)能84.96萬片。
“公司主要聚焦封裝測試主營業(yè)務(wù),近年受存儲產(chǎn)品需求增長影響,正逐步傾斜資源配置?!币患褹股封測龍頭企業(yè)近日對21世紀(jì)經(jīng)濟(jì)報道記者說道。存儲“周期(883436)”爭議
站在2026年二季度的節(jié)點回望,一個核心問題正浮出水面:本輪存儲需求的爆發(fā)式增長,究竟是周期(883436)性的價格狂歡,還是結(jié)構(gòu)性的長期變革?
今年2月,知名做空機(jī)構(gòu)香櫞公開宣布做空閃迪(SNDK),直言當(dāng)前存儲市場的繁榮不過是一場“供應(yīng)幻象”。其認(rèn)為,行業(yè)內(nèi)已有相當(dāng)于2018年峰值兩倍的產(chǎn)能“蓄勢待發(fā)”,一旦產(chǎn)能釋放,“一次財報電話會就能逆轉(zhuǎn)整個供需格局”。
消息一出,閃迪(SNDK)股價盤中一度暴跌近8%,收盤收跌4.2%,恐慌情緒迅速蔓延至全球市場,A股存儲板塊隨機(jī)走弱。
不過,在周期(883436)與泡沫的激烈博弈中,存儲板塊后續(xù)繼續(xù)走強(qiáng)。
這意味著,市場仍然站在了AI這邊。
國泰海通(HK2611)復(fù)盤指出,歷史上存儲景氣周期(883436)常維持3至4年,而本輪由AI驅(qū)動的需求具有持續(xù)的代際擴(kuò)散效應(yīng)——算法優(yōu)化不僅不會抑制需求,反而會因降低單位成本而打開更大市場。
瑞銀(UBS)最新研報認(rèn)為,AI驅(qū)動的HBM需求持續(xù)蠶食DDR產(chǎn)能,疊加傳統(tǒng)服務(wù)器換機(jī)周期(883436)與存儲SSD需求的同步爆發(fā),全球DRAM市場的供需缺口將延續(xù)至2027年第四季度,是近三十年來未曾出現(xiàn)過的存儲超級周期(883436)。
盡管行業(yè)整體受益于AI需求的拉動,但不同于存儲廠的激進(jìn),產(chǎn)業(yè)鏈公司總體上樂觀偏謹(jǐn)慎。
在中微公司(688012)日前舉行的業(yè)績說明會上,其董事長尹志堯?qū)?1世紀(jì)經(jīng)濟(jì)報道記者說道,“我在半導(dǎo)體(881121)領(lǐng)域四十多年,碰到了七次的行業(yè)大起大伏,很難去做行業(yè)預(yù)測。盡管市場普遍認(rèn)為之后一年行業(yè)還是會上漲,但我們要一直做好思想準(zhǔn)備,萬一市場下行,要有應(yīng)對措施?!?/p>
不過針對當(dāng)前的情形,他認(rèn)為也有一些不同。過去半導(dǎo)體(881121)市場的大起大伏都是因為單一產(chǎn)品的影響,但現(xiàn)在微觀器件已經(jīng)滲透了各個產(chǎn)業(yè)的方方面面,它的應(yīng)用已經(jīng)不再是單一產(chǎn)品,現(xiàn)在有AI、無人駕駛(885736)等多個應(yīng)用的推動,所以行業(yè)總體波動幅度會減緩。但仍然會有起伏,特別是宏觀經(jīng)濟(jì)的變動,會影響整個半導(dǎo)體(881121)市場。
一家PCB龍頭企業(yè)相關(guān)人士也對記者表示,“盡管2026年市場預(yù)期仍樂觀,但增速將放緩。需求旺盛導(dǎo)致公司產(chǎn)能滿負(fù)荷運轉(zhuǎn),但我們暫未調(diào)整整體戰(zhàn)略?!?/p>
“當(dāng)前存儲價格處于高位運行狀態(tài),作為智能終端關(guān)鍵元器件,其價格上漲直接推高終端產(chǎn)品的成本?!币患倚酒鲜衅髽I(yè)負(fù)責(zé)人說,“公司暫未觀察到新市場趨勢,且無法預(yù)測需求增長持續(xù)時間?!?/p>
在華邦電子看來,增長周期(883436)關(guān)鍵取決于下一階段會涌現(xiàn)出哪些“殺手級應(yīng)用”,當(dāng)前能看到的趨勢是云端AI和HBM等高帶寬產(chǎn)品占據(jù)了絕大部分的產(chǎn)能。當(dāng)前,同業(yè)都在加速填補產(chǎn)能空白,比如華邦通過推出16nm先進(jìn)制程產(chǎn)品、提升晶圓產(chǎn)出效率,或者是加大資本投入。
華邦電子還表示,“但是新廠建設(shè)、生產(chǎn)機(jī)器就緒等準(zhǔn)備工作,通常需要花費兩年時間才能真正形成實際產(chǎn)能,屆時存儲產(chǎn)品的供需將有望回歸平衡。”
