擴張與洗牌並存 國產GPU廠商發力AI生態

證券時報記者 王一鳴

前幾年廣受資本追捧的GPU(圖形處理器)這一硬核賽道正在步入洗牌期,一些原本備受矚目的通用GPU設計企業先後陷入經營困境。與此同時,有頭部企業繼續求新求變,已步入AI(人工智能)核心戰場。

對於行業現狀,北京社科院研究員王鵬向證券時報記者分析,當前國產GPU產業處於快速發展與洗牌並存的階段。一方面,隨着AI大模型的需求激增,國產GPU市場迅速崛起,涌現出如摩爾線程、壁仞科技等一批具有創新能力的企業。這些企業在技術研發、產品創新等方面取得了顯著進展,爲國產GPU行業注入了新的活力。另一方面,市場競爭也日益激烈,部分初創企業由於資金鍊斷裂、技術瓶頸等問題陷入困境,甚至面臨裁員、訴訟等風險。

“長遠來看,國產GPU行業仍具有廣闊的發展前景。這源於人工智能、大數據、雲計算等技術的快速發展,對高性能GPU的需求持續增長;同時,國家政策對半導體產業的支持力度不斷加大,爲國產GPU行業提供了良好的發展環境。此外,隨着國產芯片公司在生態構建、技術創新等方面的不斷努力,國產GPU有望逐步縮小與國際領先水平的差距。”王鵬說。

幾家歡喜幾家愁

近日,國產GPU獨角獸壁仞科技一則動態引起業內關注。該公司在上海證監局辦理IPO輔導備案登記,輔導券商爲國泰君安。這是繼今年8月26日燧原科技輔導備案報告公佈後,又一家啓動IPO的上海AI芯片企業。

壁仞科技創立於2019年,致力於研發原創性的通用計算體系,建立高效的軟硬件平臺,同時在智能計算領域提供一體化的解決方案。截至目前,公司已完成多輪融資,公開融資總額超過50億元,投資方包括啓明創投、IDG資本、中芯聚源、格力創投等。

目前,壁仞科技首款國產高端通用GPU(GPGPU)壁礪系列已量產。在9月舉行的2024全球AI芯片峰會上,壁仞科技還首次公佈了其自研的異構GPU協同訓練方案,該方案突破了大模型異構算力孤島難題,實現了在本土異構多GPU芯片算力訓練技術領域的首次突破。

另一家國內GPU獨角獸企業也有新動作。今年7月,摩爾線程宣佈對其誇娥(KUAE)智算集羣解決方案進行重大升級,從當前千卡級別大幅擴展至萬卡規模。摩爾線程創始人兼CEO張建中表示,在多元趨勢下,萬卡已是AI模型訓練主戰場的標配。

事實上,在國內,萬卡集羣建設正高歌猛進。去年7月,華爲昇騰AI集羣規模從最初的4000卡集羣擴展至16000卡,是國內首個萬卡AI集羣。

不過,當前國產GPU產業的分化亦十分明顯,一些原本備受矚目的企業接連陷入困境。今年8月底,曾獲得2024年度重慶市“獨角獸企業”稱號的象帝先被曝約400位員工被裁。公司在迴應中坦陳:“發展面臨一定的市場調整壓力……正在進行組織結構和人員配置的優化等……並尋找外部融資機會。”另一方面,象帝先股東還在起訴其創始人唐志敏,因其未能籌集到承諾的5億元B輪融資。

在象帝先陷入困境之前,同處在GPU賽道的礪算科技也曾預警。至今年8月19日,東芯股份公告擬以不超過2億元收購礪算科技37.88%股份,礪算科技的資金緊張局面方得以緩解。

GPU佔AI芯片

八成份額

在中關村物聯網產業聯盟副秘書長袁帥看來,當前國產GPU行業處於一個複雜而關鍵的轉型期,短期行業出現降溫和分化,主要是由於市場競爭加劇、技術門檻提高、資本退潮等因素導致企業資金壓力增大。在此背景下,部分實力較弱的初創企業在面對挑戰時往往更加脆弱,而頭部企業則憑藉其技術實力、市場佈局和資金優勢逐漸嶄露頭角。

按定義和應用看,GPU起初是一種顯示芯片,用於加速計算機上的圖像處理。隨着技術進步和應用範圍的擴大,GPU衍生出了GPGPU,後者是通過利用GPU並行處理能力特別強、計算能效比高的特點,處理更爲複雜的計算任務(如AI模型訓練與推理等)。基於此,如今的GPU已被廣泛應用於人工智能、虛擬現實、遊戲、科學計算等諸多領域。

IDC數據顯示,預計到2025年,GPU仍將佔據全球AI芯片八成市場份額。Gartner此前預測,2023年全球人工智能芯片(包含GPU、TPU等)的市場規模達到530億美元,並預計在2024年增長至671億美元。到2027年,全球人工智能芯片市場規模預計達到1194億美元。

從行業格局來看,作爲GPU的發明者,英偉達佔據絕對領先地位。Jon Peddie Research(JPR)數據顯示,2024年第一季度英偉達的全球AIB顯卡(也稱獨立GPU)市場份額飆升至88%,而AMD的市場份額下降至12%。JPR預計,2024年第二季度,AI訓練器GPU的出貨量將繼續增加,而遊戲AIB市場可能持平或走低。在AI芯片主戰場,據TechInsights數據,英偉達2023年的數據中心GPU出貨量約爲376萬片,比2022年多出近100萬片,市場佔比98%,收入達362億美元。壓倒性擊敗了AMD和英特爾等競爭對手。

微軟公司和Meta等數據中心運營商使用英偉達的芯片來開發和運行AI模型,巨大的需求使其銷售額和股價飆升。英偉達市值在今年6月曾登頂全球第一,達到3.33萬億美元。最新財報顯示,在英偉達Hopper(GPU構架平臺)、GPU計算和網絡平臺強勁需求的推動下,公司數據中心今年第二季度收入達到262.72億美元。

英偉達達成如今成績憑的是什麼?袁帥告訴證券時報記者,這主要源於英偉達在GPU設計、製造工藝以及軟件優化等方面具有深厚的技術積累,其產品在性能、功耗比和穩定性等方面均處於行業領先地位。同時,該公司建立了完善的生態系統,包括CUDA平臺、軟件開發工具包(SDK)以及豐富的第三方應用支持等,爲開發者提供了便捷的開發環境和廣泛的應用場景。

“英偉達的芯片產品先進且功能強大,配套軟件生態完善滲透率高,並且產品迭代進化速度快速,所以市場地位尚難以撼動。”深度科技研究院院長張孝榮認爲。

機遇和挑戰並存

國內市場方面,自2019年以來,一批國產GPU初創公司先後成立,其中涌現了壁仞科技、摩爾線程、燧原科技等AI芯片設計獨角獸。同時,還有一批老牌芯片設計公司也入局GPU領域。

這些公司的機會在於美國出口管制背景下的國產替代。2022年10月,美國政府禁止英偉達向中國出口高性能H100、A100芯片。英偉達隨後專門面向中國市場推出了不違反美國出口管制要求的A800和H800芯片,至去年10月,這兩項芯片也被限制。2024年2月,英偉達向中國市場特供的H20芯片接受預訂,但該芯片與H100配置相比,GPU核心數量減少41%,性能降低28%。對此,英偉達2023年11月曾透露,數據中心業務兩成以上受出口管制影響。

與此同時,國內GPU廠商正迎頭趕上。IDC在2023年中發佈的一項中國AI加速卡(公開市場)出貨量統計顯示,2022年上半年到2023年上半年,中國AI加速卡出貨約109萬張,英偉達市場份額爲85%,華爲市佔率爲10%,百度市佔率爲2%,寒武紀和燧原科技均爲1%。

從國內產品成果來看,不僅華爲昇騰系列表現突出。2024年5月份,摩爾線程與智譜AI開展了新一輪GPU大模型適配、性能測試。結果表明,在推理方面,摩爾線程自研全功能GPU顯著優於基準對比產品RTX 3090和RTX 4090;在訓練方面,摩爾線程誇娥千卡智算集羣的訓練精度與A100集羣相比,誤差在1%以內,而集羣性能擴展係數超過90%,模型算力利用率(MFU)與A100集羣相當。

壁仞科技則於2022年8月推出採用7nm製程的GPGPU芯片BR100,該芯片峰值算力達到國際廠商彼時在售旗艦產品3倍以上,創下國內互連帶寬紀錄。

不過,挑戰也隨之而來,一些行業領先企業先後被美國政府“盯上”。2022年12月,寒武紀等36家被美國政府列入“實體清單”。2023年10月,壁仞科技、摩爾線程等亦被添加到實體清單中。

這對相關企業影響幾何?寒武紀在2024年半年報中表示,公司及部分子公司已被列入“實體清單”,將對公司供應鏈的穩定造成一定風險。受“實體清單”等供應鏈不利因素影響,公司上半年營收6476.53萬元,較上年同期下降43.42%。

生態建設待完善

王鵬指出,當前國際政治經濟環境的變化對GPU行業產生了一定影響。特別是美國對中國AI產業的打壓政策限制了國內相關企業的進口渠道和供應鏈穩定性。

袁帥向證券時報記者表示,在面臨外部封鎖前提下,國產GPU廠商要站穩腳跟並在高端AI芯片領域爭得一席之地並非易事。在硬件層面,國內芯片代工企業在高端工藝和產能方面相對不足,難以完全滿足國產GPU設計廠商對高端AI芯片的生產需求;在軟件層面,英偉達等國際巨頭在軟件生態(CUDA等)和IP授權方面擁有強大優勢。國產GPU廠商在構建和完善軟件生態以及獲取關鍵IP授權領域仍顯薄弱。

事實上,CUDA被業內普遍認爲是英偉達最大護城河。英偉達CEO黃仁勳在今年也曾強調CUDA軟件系統生態對於AI時代的重要性。“目前,CUDA已實現良性的發展循環,全球擁有500萬開發者,覆蓋醫療保健、金融服務、計算機行業、汽車行業等領域。”黃仁勳說。

中國工程院院士,高性能計算研究所所長鄭緯民在今年7月7日的信息化百人會上指出:“這些年國產芯片無論是軟件硬件都有很大的進展,但是用戶不太喜歡用,原因是國產卡的生態系統不太好。”

鄭緯民認爲,這需要做好系統設計和相關軟件優化,具體包括十個方面:編程框架、並行加速、通信庫、算子庫、AI編譯器、編程語音、調度器、內存分配系統、容錯系統、存儲系統等。在他看來,在國產算力支撐大模型訓練時,國產AI芯片只能達到國外芯片60%的性能,但如果把前述十個方面的軟件生態做好了,客戶也會滿意。

國泰君安在今年3月發佈的《重視AI芯片配套的軟件生態》報告中總結:誰能做出中國版“CUDA”,就能佔領AI算力高地。國內各大廠商已在GPU生態上積極佈局,包括驅動程序、開發工具、應用程序接口(API)等,以確保其產品能夠更好地服務於人工智能、大數據處理、雲計算和遊戲等多樣化的應用場景。例如,華爲推出了CANN以及對應的生態體系,力求突破技術瓶頸。此外,像景嘉微、摩爾線程等公司也在自主研發GPU產品,並努力打造與之兼容的軟件環境,以減少對外部供應商的依賴,提升國產GPU的市場競爭力等。