打通國產大模型發展堵點
來源:經濟日報
今年1月,深度求索(DeepSeek)公司發佈通用大模型DeepSeek-R1,以其低成本、高性能的特徵在全球引起巨大轟動。DeepSeek的出圈是我國AI發展的重要里程碑,爲產業發展帶來了一系列有益的啓示。
DeepSeek通過並行線程執行(PTX)、混合專家模型(MoE)、多頭潛在注意力(MLA)和多Token預測(MTP)四大創新技術,在算力資源遠不及國際同行的情況下,實現模型性能的大幅追趕,並將訓練成本壓縮至行業標杆的10%。這一突破不僅有效降低了大模型部署門檻,也揭示了以算法優化彌補算力短板的可行性,爲突破西方主導的“大力出奇跡”的AI發展模式,走出多元化發展路徑提供了新方案。
同時,DeepSeek採取完全開源的策略,公開算法、模型權重及訓練細節,使全球開發者能借鑑、改進和部署模型。開源生態有助於吸引更多開發者和用戶參與,促進技術迭代,有望改變贏者通吃的競爭格局。
儘管DeepSeek取得重要突破,但也應看到,我國AI原始創新仍存短板。2023年在被引用次數最多的生成式AI研究機構前10名中,中國僅佔1席。從AI專利數、深度學習模型、機器學習加速硬件等方面來看,我國與美國也仍存差距。
當前,我國數據基礎制度建設仍處於起步階段,數據獲取和交換機制尚不健全,行業數據、公共數據獲取和訪問困難,大模型可使用的數據有限。同時,數據標註是高質量數據供給的基礎,由於專業化標註人才短缺,我國數據標註質量仍有待提升,特別是在醫療、自動駕駛等發展需求迫切且對專業性要求高的領域,數據標註的供給規模和準確度難以滿足發展需求。
從全球範圍看,DeepSeek等國產大模型在全球技術生態中的影響力仍處於起步階段。從國內看,我國AI發展從基礎研究到技術創新,再到場景應用的全鏈條尚未完全打通。支撐大模型迭代發展的技術、資金、數據、人才等要素流動仍存在梗阻,尚未形成高效的生態閉環。
爲此,應加強AI基礎研究和技術創新。加快建設AI領域的國家戰略科技力量,推動AI與數學、物理、腦科學等基礎學科交叉融合,提升AI基礎研究水平。鼓勵AI技術開源開放,以開源項目爲中心,促進開源貢獻者、服務者、使用者、運營者等主體共同推動AI技術創新。
統籌大規模數據集建設。加快數據基礎制度建設,以政府數據開放爲牽引,融合企業和行業數據,推動公共數據集、專業應用數據集建設。針對不同應用場景,制定細化的數據標註規範,針對醫療、自動駕駛等垂直領域,開展專項知識培訓,提升數據標註質量。
培育壯大AI初創企業。應發掘具有中國特色的AI初創企業估值模型和平臺系統,強化AI初創企業早期估值發現,爲政府、金融機構精準識別有潛力、高價值的AI初創企業提供科學參考,爲國產AI技術發展壯大注入活力。
打造AI自主產業生態。充分發揮我國海量數據和豐富應用場景優勢,組織科研機構、科技領軍企業等優勢力量,聚焦智能製造、自動駕駛等重點垂直細分領域,統籌佈局大模型行業應用創新(工程)中心,依託自主技術,建設集數據、算法、算力於一體的行業通用大模型平臺,形成標準化模塊化的模型、中間件及應用軟件,以開放接口、模型庫等推動產業鏈上下游深度合作,在應用中持續健全迭代自主產業生態。
(本文來源:經濟日報 作者:張鳳 吳靜 作者單位:中國科學院科技戰略諮詢研究院)