賽道Hyper | Vera Rubin:英偉達君臨AI天下秀

6月5日,英偉達股價創出新高,報收1224.40美元,漲幅5.16%,市值超越蘋果,爲3.012萬億美元,成爲美股市值第二的科技公司。蘋果市值爲3.0035萬億美元。6月3日,COMPUTEX(臺北國際電腦展)2024開幕,AI成了當仁不讓的主角和焦點。

在包括英偉達、Intel、AMD、高通、聯發科和Arm等在內的一衆各種終端芯片設計商中,英偉達當屬最受矚目者。

英偉達聯合創始人兼CEO黃仁勳在COMPUTEX2024大會上更新了AI GPU技術路線圖:2025年,英偉達將發佈Blackwell Ultra,2026年推出新架構Rubin,2027年發佈Rubin Ultra。

從2023年10月的投資者會議開始,英偉達將原本兩年一更新芯片新品的節奏,改成一年一更新。在那次會議上,黃仁勳宣佈,預計今年會推出H200和B100 GPU;2025年,英偉達X100 GPU也將面世。

根據去年10月的規劃框架,英偉達AI芯片規劃的戰略核心是“One Architecture”統一架構,支持在任何地方做模型訓練和部署,無論是數據中心(IDC)還是邊緣設備,抑或x86和Arm架構。

也就是說,英偉達AI芯片解決方案適用於超大規模數據中心的訓練任務,也可以滿足企業級用戶的邊緣計算需求,涵蓋x86或新興的Arm架構生態。

目前,英偉達同時擁有GPU、CPU和DPU(數據處理單元:Data Processing Unit)的計算芯片和系統公司。通過NVLink、NVSwitch和NVLink C2C技術,英偉達將CPU和GPU做了靈活連接組合,形成統一的硬件架構,並與CUDA一起,形成完整的軟硬件生態。

DPU是一種專門用於數據處理的處理器。與通用處理器(CPU)和圖形處理器(GPU)不同,DPU專注於數據處理,可以實現更高效的數據處理和計算。

拋開黃仁勳的軟廣告宣傳,比如回顧了英偉達在過去的成功歷程、在算力方面降低成本的努力,以及“是英偉達促成了當今的AI時代”,並且再次強調CUDA的AI平臺級價值——正是因爲有了CUDA,全球的深度學習科學家們才能充分利用其潛力,從而推動了整個行業的進步——黃仁勳也展望了生成式AI時代的未來,這部分是本次大會英偉達的戰略公示重點。

黃仁勳說,“我們現在所處的不是簡單的AI時代,而是一個生成式AI時代。在這個時代,幾乎所有事物都可以轉換成Token(詞元),並通過生成式AI進行處理和優化。”

“生成式AI將重塑各行各業,推動整個價值3萬億美元的IT產業轉型爲AI工廠,爲每個行業製作AI產品。”黃仁勳說,“未來每臺裝有RTX顯卡的PC都將成爲AI PC,能夠高效地處理和生成各種數據。”

這是不是相當於AI PC有了黃氏定義?“每臺裝有RTX顯卡的PC都將成爲AI PC”。

更核心的焦點,實際上就是黃仁勳公佈英偉達AI GPU技術路線圖:到2027年之前,英偉達會更新GPU和CPU架構,以及CPU+GPU二合一超級芯片。

黃仁勳表示,英偉達將堅持使用統一架構覆蓋整個數據中心GPU產品線,每年更新迭代一次。其中的核心,就是英偉達官宣了替代“Blackwell”架構的新一代GPU架構“Rubin”。

截至目前,英偉達高性能GPU架構代號“Blackwell”,已實現量產,相關產品包括用於HPC/AI領域的B200/GB200,以及用於遊戲的RTX 50系列。

2025年,Blackwell迭代版Blackwell Ultra將得以面市;2026年,新架構“Rubin”會推出:搭載下一代HBM4高帶寬內存(8層堆棧);2027年,“Rubin”的迭代版“Rubin Ultra”會推出,標準版的HBM4內存,由8層堆棧升級爲12層堆棧。

這裡有個細節很值得注意:“Rubin”命名源於美國女天文學家Vera Rubin(薇拉·魯賓)。

CPU方面,“Vera”架構會取代2022年3月推出的Grace CPU超級芯片。“Vera”架構名稱同樣源於Vera Rubin——前者用於英偉達新一代CPU架構名稱,後者Rubin則成爲英偉達新一代GPU架構的名稱。

此前,英偉達在其AI路線圖中,並沒有將“Grace”作爲一個獨立的CPU架構,而將之納入“Grace+GPU”的SuperChip超級芯片範疇。

這在營銷層面的表達或許不夠清晰,但實際上體現了英偉達“CPU+GPU二合一超級芯片”的策略;而此次官宣“Vera Rubin”之“CPU+GPU”架構,讓競對看到了英偉達在AI領域強悍的統治力。

在SuperChip超級芯片架構中,NVLink-C2C和NVLink互聯技術在英偉達未來的AI芯片架構中,將持續發揮關鍵作用。

本次大會上,黃仁勳公示了Vera CPU和Rubin GPU組成新一代超級芯片的最新規劃:採用第六代NVLink互連總線,帶寬高達3.6TB/s。

NVLink-C2C互聯技術的作用是什麼?

英偉達以之構建GH200、GB200和GX200超級芯片;再通過NVLink互聯技術,兩顆GH200、GB200和GX200能被鏈接成GH200NVL、GB200NVL和GX200NVL模組。之後,英偉達能將之通過NVLink網絡組成超節點,再用InfiniBand或Ethernet網絡,最終組成更大規模的AI集羣。

InfiniBand或Ethernet網絡是什麼?這是英偉達交換芯片技術:前者瞄準AI Factory,後者側重AIGC Cloud。相較於NVLink總線域網絡,InfiniBand和Ethernet屬於傳統網絡技術,兩種網絡帶寬比例大約爲1:9。

在此次大會上,黃仁勳公佈了這兩條開放的芯片交互技術路線中的InfiniBand技術和產信息更新:新一代數據中心網卡CX9 SuperNIC,最高帶寬可達1600Gbps,也就是160萬兆,搭配新的InfiniBand/以太網交換機X1600。

根據2023年10月舉行的英偉達投資者會議內容,以InfiniBand爲基礎的Quantum系列和以Ethernet基礎的Spectrum-X系列將持續升級。預計到2024年,基於100G SerDes的800G接口的交換芯片將實現商用;2025年,基於200G SerDes的1.6T接口的交換芯片也會面市。