英偉達,麻煩大了!

如果您希望可以時常見面,歡迎標星收藏哦~

來源:內容由半導體行業觀察(ID:icbank)編譯自techspot,謝謝。

Nvidia 備受期待的 Blackwell 系列 AI 芯片遭遇重大挫折。新發現的設計缺陷將使發貨延遲至少三個月。這一延遲可能會讓已下達數十億美元訂單的客戶感到非常失望。

Nvidia 備受期待的 Blackwell 系列 AI 芯片因在製造後期發現設計缺陷而面臨嚴重延遲。據The Information 援引兩位參與 Nvidia 芯片和服務器硬件生產的匿名消息人士的話稱,該問題可能需要至少三個月才能解決。

問題的關鍵在於 GB200 芯片上連接兩個 Blackwell GPU 的處理器芯片——製造商臺積電 (TSMC) 發現了這個問題。作爲迴應,Nvidia 正在修改設計,並且在開始批量生產之前需要與臺積電進行新的生產測試。作爲權宜之計,該公司正在考慮生產單 GPU 版本的 Blackwell 芯片以加快交貨速度。

此次延遲對在 Nvidia 技術上投入巨資的大型科技公司產生了深遠影響。例如,谷歌已訂購了超過 40 萬 GB200 芯片,交易金額超過 100 億美元。同樣,Meta 也下了 100 億美元的訂單,而微軟原本計劃在 2025 年第一季度爲 OpenAI 準備好 55,000 到 65,000 個 GB200 GPU——但這一時間表現在岌岌可危。

據報道,Nvidia 已通知微軟和另一家雲提供商,Blackwell 系列中最先進的 AI 芯片型號的延遲將受到影響。因此,預計這些芯片要到 2025 年第一季度才能大量出貨,這可能會擾亂這些科技巨頭的 AI 戰略。

儘管有這些報道,但 Nvidia 的官方立場仍然樂觀。該公司發言人表示,今年晚些時候“生產將按計劃加速”,但沒有直接談及報道的延遲。與此同時,受影響的公司,包括微軟、谷歌、亞馬遜網絡服務和 Meta,均拒絕置評。

此次挫折可能會讓 Nvidia 的競爭對手在 AI 芯片市場佔據一席之地。自 AI 熱潮開始以來,英特爾和 AMD 一直難以影響 Nvidia 的市場份額。然而,此次延遲可能會讓他們重新定位自己的產品,爲需要立即獲得解決方案的客戶提供可行的替代方案。

例如,AMD設計了其開源 ROCm 框架,直接與 Nvidia 的 CUDA 競爭,爲開發人員提供了一種構建 AI 應用程序的替代方案,而不必被鎖定在 Nvidia 的生態系統中。同樣,英特爾也在開發AI 加速器芯片,包括 Gaudi 系列,作爲更實惠的替代品。據英特爾稱,其 AI 加速器的價格是競爭品牌的三分之一到三分之二。

隨着客戶逐漸擺脫延遲帶來的最初失望,他們可能會質疑 Nvidia 在面臨生產挑戰和日益激烈的競爭時能否保持其 80% 的主導市場份額。隨着人工智能軍備競賽愈演愈烈,業界將密切關注 Nvidia 如何克服這一障礙,以及它能否兌現對其知名客戶的承諾。

美國反壟斷鐵拳,打向英偉達

據報道,美國司法部已對 Nvidia展開調查。此前競爭對手抱怨稱,該公司可能濫用其在銷售人工智能芯片方面的市場主導地位。報道稱,援引參與討論的人士的話稱,美國司法部調查人員正在調查英偉達是否向雲提供商施壓,要求其購買多種英偉達產品。

調查還涉及,如果客戶想從AMD等競爭對手那裡購買 AI 芯片,Nvidia 是否會向其客戶收取更高的網絡設備價格。Nvidia 佔據了大約 80% 的 AI 芯片市場。

該公司沒有對司法部調查的報道發表評論,但表示將提供監管機構要求的任何信息。

Nvidia 發言人在給路透社的一份聲明中表示:“我們憑藉數十年的投資和創新開展競爭,嚴格遵守所有法律,讓 Nvidia 在每個雲端和每個企業的內部部署中公開可用,並確保客戶可以選擇最適合他們的解決方案。”

週四晚些時候,美國司法部沒有立即迴應路透社的置評請求。

報道稱,調查人員已經聯繫了 Nvidia 的幾家競爭對手,以收集更多細節。

美國進步團體和民主黨參議員伊麗莎白·沃倫已敦促司法部就競爭問題對英偉達進行調查。

這些組織反對壟斷、提倡政府對科技公司進行監管等,其目標是反對英偉達的軟件和硬件捆綁銷售行爲,法國反壟斷執法人員在準備提起指控時已經注意到了這種做法。

英偉達的一單收購,被美國調查,涉嫌壟斷!

一家名不見經傳的以色列初創企業陷入了美國監管機構與全球最大科技公司之間的拉鋸戰,爭論的焦點是人工智能是否有被少數幾家巨頭控制的風險。

據五位知情人士透露,美國司法部律師正在以反壟斷爲由調查半導體公司 Nvidia 收購人工智能初創公司 Run:ai 一事。由於這項機密調查,五位知情人士要求匿名。兩家公司於 4 月底宣佈了這筆交易,但並未透露交易價格,不過TechCrunch 報道稱交易價格爲 7 億美元。

Run:ai 曾與 Nvidia 建立過合作關係,該公司實現了所謂的圖形處理單元 (GPU) 虛擬化,這也是 Nvidia 市值接近 3 萬億美元的原因。Run :ai 的技術本質上允許其客戶用更少的芯片做更多的事情,這是一項非常有價值的服務,因爲對芯片的需求遠遠超過供應。

過去幾年,英偉達的利潤激增,因爲其傳統上用於計算機圖形的芯片已經適應了人工智能的繁重計算工作量。

司法部展開調查之際,世界各地的監管機構正在調查蓬勃發展的人工智能行業,調查內容包括生存安全和國家安全風險、加劇消費者欺詐的可能性、公民權利侵犯以及 OpenAI ChatGPT 等消費者服務所用技術的數據版權保護等。所有這些擔憂的核心是擔心少數占主導地位的科技公司將以類似於在線商務、社交媒體、在線搜索和廣告集中的方式控制市場。

7 月底,美國司法部和聯邦貿易委員會、歐盟委員會以及英國競爭與市場管理局發表了一份不同尋常的聯合聲明,表達了對僅有少數公司擁有必要資源進行競爭的擔憂。

Nvidia 發言人 Mylene Mangalindan 表示:“Nvidia 憑藉實力取勝,這反映在我們的基準測試結果和對客戶的價值上。我們憑藉數十年的投資和創新開展競爭,嚴格遵守所有法律,讓 Nvidia 在每個雲和每個企業的本地環境中公開可用,並確保客戶可以選擇最適合他們的解決方案。”“我們將繼續支持每個行業和市場的有抱負的創新者,並樂於提供監管機構需要的任何信息。”

司法部發言人拒絕置評。Run:ai 未迴應置評請求。

據 POLITICO 此前報道,美國聯邦貿易委員會和司法部都在審查人工智能公司之間的競爭。今年 6 月,兩家機構同意分擔職責:司法部將調查英偉達的商業行爲,而聯邦貿易委員會將調查微軟及其合作伙伴 OpenAI 是否在快速發展的技術方面擁有不公平的優勢,尤其是在涉及大型語言模型方面。

Nvidia 的問題在於其在所謂的 AI 堆棧中的位置,該堆棧包括高性能半導體、大量雲計算資源、用於訓練大型語言模型的數據、集成這些組件所需的軟件以及 ChatGPT 等面向消費者的應用程序。該公司的AI Foundry平臺旨在成爲希望構建 AI 模型的客戶的一站式商店。

據估計,該公司佔據了高端 AI 芯片市場的 90%,而這些芯片通常很難獲得。

五位知情人士表示,美國司法部對英偉達的兩項調查——Run:ai 交易和英偉達的商業行爲——是獨立但又相互關聯的,而且兩項調查的重點都是該公司圍繞其 GPU 建立護城河的可能性。部分知情人士表示,作爲對該公司進行更廣泛調查的一部分,司法部調查人員一直在詢問英偉達的銷售行爲,包括該公司是否以購買其他產品爲條件獲得其芯片,或者承諾不從競爭對手那裡購買。

一些人表示,對 Run:ai 交易的一個可能的擔憂是,人們懷疑英偉達收購這家使客戶能夠用更少的計算做更多事情的公司,目的可能是埋葬一項可能抑制其主要利潤引擎的技術。

另一個可能存在爭議的問題是 Nvidia 的軟件 CUDA,開發人員使用該軟件爲 Nvidia 的 GPU 編寫應用程序。法國反壟斷機構對該行業“對 Nvidia 的 CUDA 芯片編程軟件的依賴表示擔憂(這是唯一一款與加速計算必不可少的 GPU 100% 兼容的軟件)。”該機構也在調查 Nvidia。

據一些知情人士透露,一些客戶和競爭對手指責英偉達使用銷售策略來鎖定用戶,而犧牲其他選擇,以及將必要的相關軟件捆綁到芯片中。

Run:ai 調查是拜登政府更廣泛的反壟斷舉措中的最新舉措,此舉有助於引發硅谷民衆向前總統唐納德·特朗普的轉變,並引發共和黨對聯邦貿易委員會的強烈反對。

Run:ai 調查也肯定會加劇投資者的擔憂,他們擔心聯邦貿易委員會對併購的打擊正在切斷初創企業生態系統的一個關鍵部分,在這個生態系統中,創始人和投資者嚴重依賴大公司的收購來套現。2021 年,聯邦貿易委員會和其他機構阻止了 Nvidia 收購芯片設計公司 Arm。雖然 Arm 後來成功進行了首次公開募股,但大多數初創公司從未獲得過這樣的機會。

聯邦貿易委員會還在研究雲計算市場以及微軟、亞馬遜和谷歌的人工智能投資。今年 5 月,美國司法部在斯坦福大學舉辦了一場關於競爭和人工智能的爲期一天的研討會。聯邦貿易委員會最近還舉辦了一場人工智能研討會。

● NVIDIA 收購 GPU 編排軟件提供商 Run:ai

爲了幫助客戶更有效地利用他們的 AI 計算資源,NVIDIA 今年四月宣佈已達成最終協議,收購基於 Kubernetes 的工作負載管理和編排軟件提供商 Run:ai。

客戶 AI 部署變得越來越複雜,工作負載分佈在雲、邊緣和本地數據中心基礎設施上。

管理和協調生成式人工智能、推薦系統、搜索引擎和其他工作負載需要複雜的調度,以優化系統級和底層基礎設施的性能。

Run:ai 使企業客戶能夠管理和優化他們的計算基礎設施,無論是在本地、在雲端還是在混合環境中。

該公司在Kubernetes上構建了一個開放平臺,這是現代 AI 和雲基礎設施的編排層。它支持所有流行的 Kubernetes 變體,並與第三方 AI 工具和框架集成。

Run:ai 的客戶包括多個行業的一些全球最大的企業,它們使用 Run:ai 平臺來管理數據中心規模的 GPU 集羣。

Run:ai 聯合創始人兼首席執行官 Omri Geller 表示:“自 2020 年以來,Run:ai 一直與 NVIDIA 保持密切合作,我們熱衷於幫助客戶充分利用其基礎設施。我們很高興加入 NVIDIA,並期待繼續攜手前行。”

Run:ai 平臺爲 AI 開發人員及其團隊提供:

用於管理共享計算基礎設施的集中式界面,可以更輕鬆、更快地訪問複雜的 AI 工作負載。

功能包括添加用戶、在團隊下管理用戶、提供對集羣資源的訪問、控制配額、優先級和池,以及監控和報告資源使用情況。

能夠彙集 GPU 並共享計算能力(從部分 GPU到多個 GPU 或在不同集羣上運行的多個 GPU 節點)以執行單獨的任務。

高效的 GPU 集羣資源利用率,使客戶能夠從計算投資中獲得更多收益。

NVIDIA 將在不久的將來繼續以相同的商業模式提供 Run:ai 的產品。NVIDIA 將繼續投資 Run:ai 產品路線圖,包括在NVIDIA DGX Cloud上啓用,這是一個與領先的雲平臺共同爲企業開發者設計的 AI 平臺,提供針對生成 AI 優化的集成全棧服務。

NVIDIA HGX、DGX 和 DGX Cloud 客戶將能夠使用 Run:ai 的功能來處理他們的 AI 工作負載,尤其是大型語言模型部署。Run:ai 的解決方案已經與NVIDIA DGX、NVIDIA DGX SuperPOD、NVIDIA Base Command、NGC容器和NVIDIA AI Enterprise軟件等產品集成。

NVIDIA 的加速計算平臺和 Run:ai 的平臺將繼續支持廣泛的第三方解決方案生態系統,爲客戶提供選擇和靈活性。

NVIDIA 將與 Run:ai 攜手,讓客戶擁有一個可在任何地方訪問 GPU 解決方案的單一架構。客戶有望從更好的 GPU 利用率、更好的 GPU 基礎設施管理以及開放式架構帶來的更大靈活性中獲益。

https://www.techspot.com/news/104106-nvidia-blackwell-chip-may-delayed-three-months-due.html

點這裡加關注,鎖定更多原創內容

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》爲您分享的第3847內容,歡迎關注。

『半導體第一垂直媒體』

實時 專業 原創 深度

公衆號ID:icbank

喜歡我們的內容就點“在看”分享給小夥伴哦