GB200機櫃供應鏈仍需時間優化調整 估出貨高峰將延至明年第2季後

輝達GB200 AI伺服器。(本報資料照片)

近期市場關注NVIDIA GB200整櫃式方案(rack)各項供應進度,TrendForce於最新調查指出,由於GB200 Rack在高速互通介面、熱設計功耗(TDP)等設計規格皆明顯高於市場主流,供應鏈業者需要更多時間持續調校、優化,預期最快將於2025年第2季後纔有機會放量。

NVIDIA GB Rack方案(包括GB200、GB300等)因導入技術層次更復雜、高成本等特性,主力客羣將爲大型CSP,其餘包含Tier-2資料中心、國家主權雲,以及學研單位等HPC/AI應用專案。在NVIDIA大力推動下,預期GB200 NVL72機櫃將於2025年成爲主要採用方案,佔比可望接近80%。

TrendForce表示,爲提升AI/HPC server系統整體運算效能,NVIDIA開發NVLink提供GPU晶片之間的高速互連技術,如GB200採用第五代NVLink,總頻寬大幅優於目前市場主流PCIe 5.0。此外,2024年主導市場的HGX AI server每櫃TDP動輒達60 KW至80 KW,而GB200 NVL72每櫃則達到140 KW,TDP再度提升一倍,爲此業者嘗試擴大采用液冷散熱解決方案。

由於GB200 Rack系統採用更高設計規格,市場頻傳可能因部分零組件未達要求,有遞延出貨風險。根據TrendForce調查,目前Blackwell GPU晶片出貨情形大致如原先預期,2024年第4季僅少量出貨,2025年第1季後逐季放量。在AI Server系統方面,因尚待供應鏈各環節持續調整,至今年底的出貨量恐低於業者預期,據此,2025年GB200整機櫃的出貨高峰將略爲延後。

傳統氣冷散熱解決方案已無法應對GB200 NVL72的TDP值,液冷技術成爲其必須。隨着GB200 Rack方案於2024年底開始小量出貨,相關業者也加大液冷散熱零組件研發能量,如冷卻分配系統(CDU)供應商正透過擴大機櫃尺寸,和採用更高效的冷卻板(Cold Plate)提高散熱效能。TrendForce表示,目前Sidecar CDU的散熱能力主要集中於60KW至80 KW,未來可望達成雙倍、甚至逾3倍的散熱表現。至於更高效的液對液(L2L)型in-row CDU方案,散熱能力已能超過1.3MW,未來也將繼續提升以因應算力增長。