供需錯配、重複建設,國內算力中心探路智能化升級丨算力網風雲②

編者按:

在數字經濟潮涌與大模型井噴的時代,算力正如水、電一般,正在逐日成爲現代社會賴以生存的稀缺資源。可以說,誰擁有了算力的主導權,誰就捏住了面向人工智能的頭等船票。

這樣的時代巨浪下,我國的算力也正在已步入高速發展新階段。截至2023年底,我國提供算力服務的在用機架數達到810萬標準機架,算力總規模居全球第二位。

在這個過程中,構建全國一體化算力網更是應對新一輪科技革命和產業變革的重要舉措。2022年2月,“東數西算”超級工程的啓動,嘗試拉開下一個時代的序幕。今年的《政府工作報告》明確指出,2024年要適度超前建設數字基礎設施,加快形成全國一體化算力體系。

在“東數西算”工程公佈兩年之際,當前我國算力網體系建設現狀如何?如何進一步強化全國一體化算力體系?在推進全國一體化算力體系建設的過程中,存在哪些難點堵點?就此,21世紀經濟報道推出“算力網風雲”系列報道,圍繞中國算力一體化體系建設現狀、難點與堵點、產業鏈機會等進行全方位解讀。

專題第二篇聚焦算力結構性不足及因地制宜問題。未來人工智能應用將成爲信息應用的主流,對智能算力有較高需求,然而目前智能算力規模佔比不足三成。同時,現在全國多地在搶建算力中心,如何警惕算力產業重複建設和潛在的低端產能過程問題,也值得考量。

21世紀經濟報道記者張梓桐上海報道

AI熱潮下,中國智能算力需求及市場規模正在快速擴張。而智算中心作爲智慧時代承載算力的關鍵基礎設施,在政策、市場的雙重驅動下,進入了高速建設週期,應用前景及賦能潛力逐步凸顯。

據21世紀經濟報道記者不完全統計,截至2023年底,全國帶有“智算中心”的項目有128個,其中83個項目有規模披露,超過7.7萬P;這些智算中心標準不一、規模各樣,算力規模一般在50P、100P、500P、1000P,有的甚至達到12000P以上。

而工信部發布的《算力基礎設施高質量發展行動計劃》表明,2023年智算中心達到30個,算力規模達到220 EFLOPS,其中智能算力佔35%,相當於7.7萬P。預計到2028年中國智能算力規模將接近2800 EFLOPS(EFLOPS是指每秒百億億次浮點運算次數),顯示出智算中心行業的廣闊前景。

然而,當前我國算力建設仍然面臨着供需錯配、價格昂貴、重複建設等結構性難題。其中,算力成本的昂貴成爲行業面臨的最爲急切的難題。

“目前偏大規模的算力需求以B端和G端爲主,算力降本需求十分迫切,要利用有限資金獲取更多元的算力,同時優化算力資源配置和利用效率。”畢馬威中國數字化賦能主管合夥人張慶傑接受21世紀經濟報道記者採訪時表示,在計算資源方面,大模型的訓練需要大量的計算資源,包括CPU、GPU、TPU等。雖然中國算力具備一定的基礎,但在計算資源方面還存在一定的短板,各行各業在底層計算資源上存在缺乏,這會限制大模型的訓練和優化。

而從全國宏觀層面來看,算力產業建設要以需求爲引導,立足生成式AI和人工智能產業的未來,綜合考量大模型技術在千行百業的落地進展,再根據各地發展需求,謀定算力建設方案。“以公有云的方式納管多地不同的智算中心,協同提供智能算力服務,通過算力服務的精細化運營提升對算力的利用效率,可有效減輕可能的投資浪費和供給過剩。”受訪專家說道。

智能算力供需錯配

生成式AI帶來的智能時代已經成爲看得到的未來。但與此同時,技術的演進也對智能算力水平提出了更高的要求。

從國內實踐來看,目前國內模型規模還是千億級的參數,要達到ChatGPT4的級別,需要大量增加智能算力的供給才能訓練更大參數量的模型,就訓練來說算力仍然存在較大缺口;而有觀點認爲,到了推理時代,產業對智能算力的需求會是目前的四倍。

北電數智戰略與市場負責人楊震在接受21世紀經濟報道記者專訪時表示,當前我國算力供需結構方面主要面臨“智能算力佔比低、算力利用率較低、國產算力利用程度不高”三大難題。

根據中國信通院發佈的《中國算力發展指數白皮書(2023年)》顯示,在目前的算力規模中,通用算力規模佔比達74%,智能算力規模佔比達25% 。“當前訓練時代對智算消耗就相當巨大,當未來AI進入推理時代,更無法滿足當前市場需求,且目前智能算力資源緊張,算力成本高企。與此同時,大多數智算服務仍是‘裸金屬租賃’的粗放式經營方式,無法精準滿足不同企業的多元化需求,造成算力浪費。”

此外,楊震指出,由於國內算力產業鏈企業相對分散,國產算力利用效率並不高,國內存在多家芯片廠商和大模型企業,各家企業技術路徑不同,造成芯片和模型之間不適配。

楊震告訴21世紀經濟報道記者,從技術角度來看,解決供需錯配問題可以以混元異構方式形成芯片混池,提升智能算力的數量供給與性能:北電數智的AIDC通過納管國內外不同類型芯片,形成混元算力池,同時,大規模提高適配算力集羣規模,配合算法加速、混池超分等精細化調度與運營技術,提高每一塊算力卡的計算性能,使更多的國產算力可以被有效使用起來。

警惕算力中心“產能過剩”風險

在智能算力資源如此緊缺,同時供需錯配問題較爲突出的背景下,我國各地都在加速建設算力中心,但是在業內人士看來,僅以提高硬件性能和囤積硬件的方式,從根本上難以解決算力結構不足、智能算力資源緊張的難題。

國家信息中心信息化和產業發展部主任單志廣此前在接受21世紀經濟報道記者採訪時表示,現在全國多地在搶建算力中心,主要的推手不是應用需求,而是建設廠商的供給需求。但目前大模型技術在落地場景上還存在問題,尚未形成典型的殺手級應用,所以對中國的算力需求還是有限的。如果智能算力建得太早、太多,可能就會形成算力經濟發展過熱的問題,還會對行業本身實現“雙碳”目標造成多餘的壓力。

“東數西算”是其中一個典型例證,從市場邏輯來看,其本應是一個高效利用資源,減少浪費的高效路徑,畢竟建一個數據中心至少需要數萬平方米的土地,這對於地價更高的東部來說需要投入的資金和人力成本極高;其次,大規模的計算中心、存儲中心對電力的需求很高,尤其散熱是數據中心的“耗電大戶”,爲了保證服務器長時間穩定工作,數據中心需要消耗大量的電力給它們降溫。而這些問題,在西部地區可以得到有效解決。但過去國內“東數西算”項目建設中落地的多爲傳統數據中心,其智算升級已經是大勢所趨。

楊震告訴21世紀經濟報道記者,在算力產業,傳統數據中心以生產通用算力爲主,機櫃功率低,設備老化,能耗高,PUE值也居高不下,造成運營成本較高,且不少機房建設時間較早,空間和擴展受限制,無法滿足當下人工智能產業不斷增長的市場需求。因此,傳統數據中心的改造升級已經是大勢所趨。

“通過智算化改造,包括對機櫃、供電、製冷以及運維等全方位的升級,滿足智能算力生產的條件,部署國內外不同芯片,增加智能算力生產,推動過去的重資產、重硬件模式向軟硬協同、服務驅動轉型升級。這不僅可以實現模式創新和資產盤活,還推動了城市煥新。”楊震說道。

“全國一張網”

在業內人士看來,在算力中心當前已經成爲我國新興“基礎設施”的背景下,全國宏觀層面的統一部署和調控就顯得尤爲必要。

國家數據局黨組書記、局長劉烈宏撰文此前就指出,2023年12月,國家發展改革委、國家數據局等部門聯合印發的《關於深入實施“東數西算”工程 加快構建全國一體化算力網的實施意見》,着眼於通用算力、智能算力、超級算力一體化佈局,東中西部算力一體化協同,算力與數據、算法一體化應用,算力與綠色電力一體化融合,算力發展與安全保障一體化推進等五個“一體化”,旨在從戰略上加快綜合算力基礎設施體系和全國一體化算力網建設,對於推動數字中國建設、實現中國式現代化具有重要意義。

從地方層面來看,近日,北京市經濟和信息化局和北京市通信管理局聯合發佈《北京市算力基礎設施建設實施方案(2024—2027年)》。其中提到,改變智算建設“小、散”局面,集中建設一批智算單一大集羣,到2025年,本市智算供給規模達到45EFLOPS,2025-2027年根據人工智能大模型發展需要和國家相關部署進一步優化算力佈局。

而上海則以市場化手段引導的方式,通過資金補貼來提升智能算力能力。

根據上海近期發佈的《中國(上海)自由貿易試驗區臨港新片區進一步集聚發展新型算力賦能新質生產力若干政策》,對智算集羣總體投產規模達到1000PFLOPS以上的新型計算中心,資助週期不超過5年,資助金額不超過1000萬元。同時,鼓勵算力調度,對臨港新片區算力調度平臺調度總量所對應的調度費用,提供5年內不超過1000萬元的支持。在提升綠色智算水平、支持自主可控的智算要素等方面,均有相應的支持補貼政策。

在張慶傑看來,地方政府牽頭支持算力普惠化非常具有針對性。“中國是世界人工智能重要領軍國家之一,但做大模型還面臨多方面的挑戰,需要在政策、技術、資源、人才培養等方面進行綜合的改革和發展。在投入成本方面,大模型的訓練需要大量的資金支持,包括硬件設備、人才引進、技術研發等方面的投入,這在一定程度上要依賴政府的支持,同時,行業應該在專業人才、技術生態以及計算架構方面進行發力,來進一步夯實算力基礎。”

中國社會科學院中國城市發展研究會副理事長賀可嘉則對21世紀經濟報道記者表示,構建全國統一的算力服務大市場的前提,是建立統一的算力服務市場準入標準、監管機制和規範,確保市場的公平競爭和規範運行,繼而打造統一的算力服務平臺,整合各類算力資源,爲用戶提供一站式服務,降低用戶獲取算力資源的成本。同時,加強算力互聯互通,實現資源共享和協同,推動算力服務市場的統一化和規模化發展。此外,還應積極參與國際算力服務市場的合作與交流,吸引國際優質算力服務資源與我國市場進行互動。