發(fā)布漲價公告后股價“20CM”漲停!紅包大戰(zhàn)正酣,算力租賃賺翻?

來源: 每日經(jīng)濟新聞

  當下,AI大模型正處于從生成式AI走向代理式AI的關(guān)鍵時刻。在此背景下,騰訊、阿里等廠商不惜大發(fā)紅包以爭奪用戶。

  在大模型廠商紅包大戰(zhàn)尚未分出勝負之際,算力租賃廠商卻成為當下實實在在的贏家。正如服飾品牌李維斯的故事那般,最終贏家不是在加州挖金子的礦工,而是賣牛仔褲的李維斯。在這一輪大模型紅包大戰(zhàn)中,算力租賃賺得盆滿缽滿。

  2月11日,云計算服務(wù)商優(yōu)刻得發(fā)布漲價公告。在被問及具體哪些產(chǎn)品漲價時,優(yōu)刻得相關(guān)工作人員告訴《每日經(jīng)濟新聞》記者(以下簡稱每經(jīng)記者),“全線產(chǎn)品(都會上漲),具體會根據(jù)客戶資源使用情況給出方案!

  值得一提的是,宣布漲價后,優(yōu)刻得昨日股價高開高走,收漲20%。

  紅包大戰(zhàn)帶來對AI基礎(chǔ)設(shè)施的巨大需求

  2015年除夕,微信支付憑借搖一搖搶紅包,迅速爆發(fā)。而這一波,騰訊元寶發(fā)紅包之后,阿里巴巴、百度、字節(jié)跳動也紛紛下場。

  紅包大戰(zhàn),也使得對AI基礎(chǔ)設(shè)施的需求大增。

  近日,國內(nèi)云服務(wù)廠商優(yōu)刻得宣布,因全球供應(yīng)鏈波動持續(xù)加劇,核心硬件采購等基礎(chǔ)設(shè)施成本出現(xiàn)顯著、結(jié)構(gòu)性的上漲,經(jīng)過慎重評估,公司決定自2026年3月1日起,對續(xù)簽及新簽用戶的全線產(chǎn)品與服務(wù)進行價格上浮調(diào)整。

  漲價緣由是硬件成本提升,還是推理側(cè)需求過于旺盛而導(dǎo)致供不應(yīng)求?優(yōu)刻得上述工作人員回復(fù)稱:“兩方面(原因)都有,主要是硬件成本上升,近期需求也在增加。當前的價格調(diào)整,也是行業(yè)從‘資源出租’向‘能力服務(wù)’轉(zhuǎn)變的體現(xiàn)!

  不僅僅是國內(nèi)廠商在漲價。1月23日,全球云計算巨頭亞馬遜云科技宣布對其面向大模型訓(xùn)練的EC2機器學(xué)習(xí)容量塊實施約15%的價格上調(diào),這是AWS(亞馬遜云計算服務(wù))約20年來首次打破“只降不漲”的定價傳統(tǒng)。機器學(xué)習(xí)容量塊是AWS為應(yīng)對高性能GPU(圖形處理器)等稀缺計算資源供需失衡所推出的定制化服務(wù)模式,用戶可提前預(yù)訂指定型號的GPU實例,確保關(guān)鍵算力資源的穩(wěn)定供給。

  開源證券認為,AWS作為亞馬遜核心的公有云平臺,此次漲價一方面再次確認了全球AI算力需求端的高景氣度,另一方面從供給角度來看,AI云產(chǎn)業(yè)鏈資源稀缺性或日益凸顯。

  Agent拉動推理需求呈指數(shù)級上漲

  對于公有云漲價,云服務(wù)商派歐云(PPIO)工作人員告訴每經(jīng)記者,主要原因是推理需求的爆發(fā)式增長,其中Agent(智能體)的需求是主要增長因素;其次推理成本的上漲動力還來自服務(wù)質(zhì)量的持續(xù)提高,高SLA(服務(wù)等級協(xié)議)、低時延、長上下文、多模態(tài)等服務(wù)會產(chǎn)生支付溢價。

  如果說紅包大戰(zhàn)帶來的是用戶人數(shù)增加從而帶來算力需求提升,那么Agent的盛行,對推理算力需求的提升則更為龐大。

  優(yōu)刻得上述工作人員表示:“算力需求已從訓(xùn)練驅(qū)動的單一模式,轉(zhuǎn)變?yōu)橛?xùn)練+推理雙輪驅(qū)動且推理占比不斷上升的新模式。Agent的實時交互、多輪推理、工具調(diào)用與自主規(guī)劃等能力,使得單次任務(wù)所需的推理次數(shù)呈指數(shù)級上升!

  PPIO工作人員也對每經(jīng)記者表示:“Agent的廣泛應(yīng)用放大了Token(詞元)的消耗,進而推高算力需求,一方面Agent推理上下文逐漸增加到200K以上,另一方面由于計算復(fù)雜度與上下文長度是平方關(guān)系,長上下文對算力的需求呈指數(shù)級增長。據(jù)我們估算,Agent場景下單用戶的Token消耗量是普通Chat的10倍至50倍,此外Agent對內(nèi)存的需求也在持續(xù)增加,主要體現(xiàn)在Agent工具的數(shù)據(jù)記憶需求!

  值得注意的是,AI推理不僅有云端,也有邊緣側(cè)、端側(cè)設(shè)備。那么,即時性的要求是否會助推邊緣側(cè)、端側(cè)AI推理需求增長?

  對此,PPIO工作人員表示:“至于邊緣和端側(cè),我認為會增加部署,但會是“云—邊—端協(xié)同”的混合架構(gòu):實時性強、隱私要求高、網(wǎng)絡(luò)不穩(wěn)定的場景會下沉到端和邊緣,用小模型或本地推理保證響應(yīng);而需要最強通用能力、快速迭代的大模型能力,仍會集中在云端。關(guān)鍵不在把所有算力搬到端上,而在把任務(wù)鏈路切分得更合理。”

  優(yōu)刻得工作人員也表示:“我們會根據(jù)客戶的需求來部署我們的產(chǎn)品和資源。根據(jù)不同業(yè)務(wù)場景對延遲、成本、合規(guī)性的差異化要求,靈活調(diào)度云端、邊緣與端側(cè)算力資源。”

關(guān)注同花順財經(jīng)(ths518),獲取更多機會

0

+1
  • 北信源
  • 兆易創(chuàng)新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉視傳媒
  • 御銀股份
  • 中油資本
  • 代碼|股票名稱 最新 漲跌幅