10個月內租金猛降50%,英偉達H100爲何不香了?丨焦點分析
作者丨邱曉芬
編輯丨蘇建勳
近期,英偉達卡租賃價格崩潰的話題,引起了AI行業的熱議。外網一篇流傳甚廣的文章中,用“英偉達GPU租賃泡沫破裂”這一驚悚的表達,來形容當下這一趨勢。
36氪瞭解到,英偉達核心產品在中國的租賃價格劇烈波動確實是事實,英偉達熱門芯片在2024年的租賃價格走勢如下——
英偉達H100,一般以8卡爲一個節點的形式出租。一個節點年初的市場報價在12-18萬/年之間浮動,如今徘徊在7萬元前後;
消費級顯卡“英偉達4090”,此前“挖礦熱”時一度被炒至一萬八、九,一卡難求。今年年初,“英偉達4090”單片的年租賃價格爲一萬三左右,目前的租賃價格大概是七八千。
也就是說,英偉達這兩款熱門芯片租賃價在10個月內雙雙降了50%,不再是前兩年一卡難求的香餑餑。
不過,多位行業人士表示,不像外網文章那般聳人聽聞,這並不需要恐慌。有行業人士測算,過去常規算力芯片租賃價格,在五年內大致有80%的下滑——英偉達H100、4090的發佈時間是2022年,距今2年,大致符合價格下降的客觀規律。
當然還有其他原因的綜合作用。英偉達熱門芯片租賃價格的下滑,本質上是英偉達產品週期、以及算力市場供需變化等因素的作用力。
而面對市場的新變化,國內的算力行業也在緊急做出各種調整。
算力供需天平傾斜
英偉達芯片租賃價格下降,與英偉達當下處於新舊產品交接期有關。
一位行業人士表示,相比H100,英偉達今年的Blackwell架構新品GB200,單位算力成本更低,而大部分AI公司基於降本考慮,基本選擇“蹲新品”,致使老產品一定程度上遇冷。
在黃仁勳的描述中,新品完全是另外一副光景——其稱,Blackwell芯片需求旺盛,導致份額分配就像“走鋼絲”,他一不小心就會“得罪大客戶們”。
但縱使萬衆期待,這款新品卻面臨着尷尬延期問題。
英偉達的工程師們把困境歸咎到臺積電採用了一項全新的封裝技術上;臺積電方面則指責英偉達瘋狂催促生產流程,給予他們比以往過短的驗證時間。這導致,英偉達本應在今年第三季度就推向市場的新芯片,如今推遲到第四季度甚至明年。
一位芯片行業人士向36氪預測,在GB200正式面世後,英偉達老芯片租賃價格下跌態勢很有可能進一步加劇,其判斷,“預計近半年內不會恢復”。
此外,英偉達產品租賃價格的猛烈下降,還與目前算力市場供給與需求並不匹配有關。
在國內,算力行業的佈局模式與國外相反——國內是先搭好算力的池子,再逐步發展AI應用,是“拿着釘子找錘子”;而國外的算力行業更加商業化一些,更傾向於找到了確切客戶後,再建與之匹配的算力中心。
有行業統計數據顯示,最近兩年,國內總共涌現了大大小小1.3萬個智算中心,截至2024年上半年,國內算力規模已達全球第三(246 EFLOPS),智能算力同比增速超過65%。
在這次建設潮中,國內也同步掀起了英偉達H100芯片的囤積潮。當這些芯片以中國香港、新加坡爲中轉站,好不容易憑藉各種隱秘方式進入國內,算力行業卻悲觀發現,原本最消耗算力的預訓練,訴求普遍下滑。(詳情點擊:《大模型「六小虎」裡,至少兩家要放棄大模型了 | 焦點分析》)
與此同時,2024年以來,儘管推理和模型微調的需求有所反超,大有超過預訓練的態勢,但也同樣沒有達到原先設想的“爆發”態勢,“目前還沒有看到AI的超級應用、或者明確的場景”。
當最近兩年囤積大量芯片所產生的算力,短時間內並沒有廣泛的AI應用得以消納,算力行業供給和需求的天平傾斜,價格的下滑也在意料之內。
從前買卡,現在租卡
在過去,算力行業一項目普遍的商業模式是賣英偉達“裸金屬”,行業俗稱“賣鐵”。但在算力行業供需變化的當下,純賣硬件的模式過於簡單粗暴,很難持續。尤其是,當英偉達租賃價格今年以來出現“崩盤”,下游AI行業對於算力芯片的觀念也悄然發生變化。
如果說,前兩年誰能買斷更多英偉達芯片,就意味着誰就最有機會更快訓出更強大的模型。而現在的AI公司們,更傾向於選擇租賃芯片的方式獲得算力,而非直接買斷芯片重資產、擠佔現金流。
爲此,上游的算力行業也做出了相應調整來適應這種趨勢,嘗試推出更多元的租賃服務。
一位行業人士表示,過去AI廠商若租用英偉達卡,基本需要多個節點、按年起租。但今年的變化是,有算力需求的客戶不僅變得分散,同時,他們對成本也變得格外敏感,分時租賃的要求變得很高。
“現在一些算力中心也允許你一次只租幾張英偉達的卡、只租用幾個小時”。這有點像,過去你需要按年整租一兩層樓,但現在允許你短租一間房了。
不過,這種變化的直接後果是,算力行業的回本週期變得更長。有行業人士向36氪粗略測算,“一個用H100芯片搭建的算力中心,硬件回本週期高達5年以上”。
與此同時,算力行業從業者們,正在嘗試增加算力服務的顆粒度,有逐漸向上層的模型層、應用層延伸的趨勢。
36氪瞭解到,一些智算中心運營方在賣算力之餘,也會順帶幫助下游的AI客戶做好模型的微調;
或者直接深入幾個對算力需求更強的行業,比如金融、醫藥、新能源,與具體的場景做結合,挖掘更多可以賣算力/租算力的潛在需求。
前述行業人士表示,他們經過測算,搭配着種種AI服務,“硬件的成本回本週期,最短能縮減到2年左右”。
這些調整都不是壞事。當AI行業和算力行業共同經過兩年的高速狂奔,如今供需關係變得更清晰,而這兩方正用更理性的眼光,看待過去兩年他們視若珍寶的英偉達芯片。
end
end