蘋果承認:AI模型使用谷歌定製芯片訓練

7月30日消息,美國時間週一,蘋果公司表示,其人工智能系統的核心模型在谷歌設計的處理器上完成預訓練。這一跡象表明,在訓練尖端人工智能方面,大型科技公司正在探索除英偉達GPU以外的其他替代方案。

蘋果在最新發表的技術論文中承認,該公司採用了谷歌張量處理單元(TPU)訓練其人工智能模型。另外,蘋果於週一推出了面向部分用戶的蘋果智能(Apple Intelligence)預覽版。

長期以來,英偉達的高性能GPU在高端人工智能模型訓練市場佔據主導地位,包括OpenAI、微軟、Anthropic在內的多家科技公司紛紛採用其GPU來加速模型訓練。但在過去幾年裡,英偉達GPU始終供不應求,爲此谷歌、Meta、甲骨文及特斯拉等企業都在自研芯片,以滿足各自人工智能系統與產品開發的需求。

Meta首席執行官馬克·扎克伯格(Mark Zuckerberg)和Alphabet首席執行官桑達爾·皮查伊(Sundar Pichai)上週均發表見解,暗示他們的公司和業界其他公司在人工智能基礎設施上可能存在過度投資的現象,但同時也強調,不如此做則面臨極高的商業風險。扎克伯格特別指出,若在這方面落後,將可能在未來10至15年內於關鍵技術領域失去競爭優勢。

在47頁技術論文中,蘋果公司雖未直接提及谷歌或英偉達,但明確表示其Attentional Factorization Machines(AFM)模型及AFM服務器均是在“雲TPU集羣”環境下完成訓練的,這間接表明蘋果採用了雲服務商提供的資源來進行計算任務。

論文中,蘋果強調:“該系統的應用使我們能夠高效且可擴展地訓練AFM模型,涵蓋從設備端AFM到服務器端AFM,乃至更大規模的模型。”

截至目前,蘋果與谷歌的官方代表尚未對置評請求作出迴應。

蘋果相較於衆多同行,較晚揭曉了其人工智能戰略藍圖,而在OpenAI於2022年底推出ChatGPT後,其他公司就已經迅速掀起了對生成式人工智能技術的熱烈追捧。本週一,蘋果正式推出了蘋果智能,該系統攜帶着一系列創新功能亮相,如Siri的全新界面設計、顯著提升的自然語言處理能力以及文本域內的人工智能自動摘要功能。

未來一年內,蘋果計劃推出基於生成式人工智能的更多功能,包括圖像與表情的自動生成,以及Siri的強化版,該版本將能利用用戶的個性化信息,在各類應用中執行更爲複雜和個性化的任務。

在週一發佈的技術論文中,蘋果透露了其設備上AFM模型訓練的具體細節,即該模型是在一個包含2048個最新TPU v5p芯片的獨立“切片”上完成的。TPU v5p是當前最先進的張量處理單元,於去年12月首次面世。而AFM服務器的訓練則更爲龐大,它利用了8192個TPU v4芯片,這些芯片被精心配置爲八個切片,通過網絡協同工作在數據中心內,共同支撐起服務器的強大計算需求。

據谷歌官方信息,其最新TPU的運行成本每小時不足2美元,但客戶需提前三年預訂以確保使用。自2015年專爲內部工作負載設計的TPU問世以來,谷歌於2017年將其向公衆開放,如今,TPU已成爲人工智能領域最爲成熟和先進的定製芯片之一。

值得注意的是,儘管擁有自主研發的TPU,谷歌仍保持着英偉達頂級客戶的地位,同時使用英偉達的GPU與自家TPU訓練人工智能系統,並在其雲平臺上提供英偉達技術的使用權。

蘋果此前則表示,推理過程(利用預訓練的人工智能模型進行內容生成或預測)將部分在其自有數據中心的芯片上執行。

這是蘋果近期發佈的第二篇關於其人工智能系統的技術論文,繼6月份更廣泛概述的版本後,進一步確認了公司在開發過程中採用了TPU。(小小)