NVIDIA攜手Oracle 加速AI及處理龐大資料

在Oracle CloudWorld大會上,Oracle宣佈推出全球首個zettascale(10的21次方)運算規模的OCI Supercluster。該系統由NVIDIA Blackwell平臺加速運行,支持超過10萬顆NVIDIA最新一代GPU,用於訓練和部署下一代AI模型。OCI Supercluster系統將於2024年上半年推出,並可擴展至131,072顆Blackwell GPU,峰值AI運算能力達到2.4zettaflops。該系統還支援NVIDIA ConnectX-7NIC和Quantum-2InfiniBand網路,適用於內部部署、公有云和主權雲環境,爲企業提供靈活部署選項。

Oracle還宣佈推出NVIDIA GB200NVL72液冷裸機執行個體,支援生成式AI應用的訓練和推論。該執行個體利用Quantum-2InfiniBand,能夠在72顆GPU的NVLink網域內運行,實現上兆個參數模型的即時推論。OCI也將於今年提供NVIDIA HGX H200GPU平臺,透過NVLink和NVLink Switch連接8 顆H200Tensor核心GPU,並在RoCEv2網路上擴展至65,536顆GPU,支持大規模即時推論和訓練工作負載。

此外,Oracle宣佈推出針對中階AI工作負載及NVIDIA Omniverse視覺化應用的L40S GPU加速執行個體,進一步擴展企業在邊緣及雲端環境中的AI運算能力。Oracle的Roving Edge Device v2邊緣產品,現可支援最多三個NVIDIA L4Tensor核心GPU,幫助企業在遠端環境中運行AI應用。

多家企業已利用NVIDIA加速的OCI Supercluster推動AI創新。AI新創公司Reka就在此叢集上開發了多模態AI模型,用於開發能聽、說、讀、看的企業代理。Reka共同創辦人Dani Yogatama表示,該公司的多模態AI模型依賴於NVIDIA GPU加速基礎設施,能夠輕鬆處理大規模模型並高效擴展訓練工作負載。

NVIDIA與Oracle也展示了三項基於GPU的功能,展示如何加速生成式AI應用的開發,包括向量嵌入加速、向量圖索引加速以及推論微服務的應用,進一步提升企業資料處理效能。

透過這些創新,NVIDIA 與 Oracle 正協助全球企業和政府實現 AI 應用的突破,滿足資料主權需求並加強經濟韌性。