中關村得助大模型平臺2.0發佈:算力統一調度、5分鐘構建應用
智東西作者 汪越編輯 漠影
智東西12月12日報道,今天下午,2024大模型技術與應用創新論壇在京順利舉辦。論壇現場,中關村科金總裁喻友平正式發佈中關村科金大模型時代的“三級引擎戰略”,並推出得助大模型平臺 2.0 ,以及一系列大模型應用。
據喻友平介紹,基於得助大模型平臺2.0,中關村科金已與各行業夥伴一起構建了200+覆蓋智能營銷、智能客服、智能運營和知識管理四大核心場景的應用。
此外,中國工程院院士、清華大學計算機系教授鄭緯民院士分享了國產計算系統面臨的兩大技術瓶頸:構建國產萬卡系統的重大挑戰,以及異構卡和異地卡聯合訓練效果不佳。
ChatGPT核心研發科學家、前OpenAI研究員、全球頂級人工智能科學家肯尼斯·斯坦利(Kenneth Stanley)談道,隨着Scaling Law效應的減弱,未來人工智能的發展將不再依賴簡單的擴展,而是需要全新的架構和理念。
中國信通院人工智能研究所平臺與工程化部主任曹峰稱,通過優化Agent的工作流,即使在大模型能力達到上限時,也能進一步提升任務的準確性和輸出質量。
一、中關村科金髮布大模型平臺2.0,構建200+核心場景應用
在論壇的核心發佈環節,中關村科金總裁喻友平介紹了該公司針對大模型時代的企業智能化升級戰略,併發布了得助大模型平臺2.0。該平臺旨在爲企業提供一個全面支持大模型應用的生態系統,推動智能化轉型。
得助大模型平臺2.0採用的“三級引擎戰略”包括平臺、應用和服務三個核心組成部分,旨在爲企業提供從算力調度到應用落地的完整解決方案。
得助大模型平臺2.0具備以下核心功能:
1、算力統一調度:支持GPU算力共享和模型的統一管理,提升資源利用率和部署效率。
2、一站式模型訓推服務:兼容所有開源模型及開放的MaaS平臺,爲用戶提供從模型訓練到推理部署的全流程支持。
3、快速應用構建:通過多樣化的組件選擇,包括邏輯組件、通用組件、場景組件等,支持客戶在5到10分鐘內構建符合需求的應用。
4、高效的RAG技術:針對複雜版式訓練優化,確保高達98%以上的識別準確率。
目前,得助大模型平臺2.0已在多個行業中得到應用。中關村科金與行業合作伙伴共同構建了超過200個大模型應用,涵蓋智能營銷、智能客服、智能運營和知識管理等核心領域。
例如,一家裝平臺利用大模型外呼技術,在活動營銷中實現了3.5%的轉化率,相比傳統AI外呼提升了130%;另外,聯合多個省市公安機關推出的大模型接警助手,將反詐接警全流程的週期從30分鐘縮短至2分鐘。
二、清華大學鄭緯民:國產萬卡系統構建艱難,異構卡聯合訓練效果不佳
在人工智能進入大模型時代的過程中,清華大學計算機系教授、中國工程院院士鄭緯民分享了人工智能發展的兩大趨勢:一是 AI 基礎大模型從單模態向多模態發展,二是大模型加速行業智能化升級。
鄭緯民院士談道,隨着大模型技術的成熟,將會有三類企業脫穎而出:一是研發大模型的企業,二是推動大模型應用落地的企業,三是提供支持大模型計算系統的企業。中關村科金作爲應用落地的典型代表,在這一過程中扮演了重要角色。
當前外部因素如英偉達對中國高性能芯片的限制,促使中國加速建設本地化計算系統,特別是在數據實地化、內容主題化和算力國產化方面取得了進展。然而,國產硬件的生態環境仍不完善,導致許多企業不願意採納,這成爲了制約人工智能進一步發展的關鍵因素。鄭緯民院士說:“優秀的系統軟件才能充分發揮底層硬件的算力潛力,當前我們必須着力打造10個核心軟件。”
鄭緯民院士還討論了構建國產萬卡系統的困難。“儘管建設國產萬卡系統至關重要,但目前面臨的技術難題相當複雜,尤其是在多廠商異構硬件組合使用時,往往會導致性能急劇下降,甚至使用新一代與舊一代 CPU 混合時,整體性能會低於僅使用舊一代 CPU 的情況。”這一現象也被形容爲“木桶效應”,即系統性能受到最弱環節的限制。
在談到異構卡聯合訓練時,鄭緯民院士說,目前這一技術在跨地理位置數據中心(異地卡)訓練中面臨的挑戰。由於高延遲問題,異地卡聯合訓練的效果遠低於預期。因此,鄭院士建議,在成本效益尚不明確的情況下,短期內應避免過度依賴這一方案。
三、前OpenAI研究員斯坦利:AI突破需新架構,幻覺非創造力
ChatGPT核心研發科學家、前OpenAI研究員、全球頂級人工智能科學家肯尼斯·斯坦利(Kenneth Stanley)談道,隨着Scaling Law效應逐漸減弱,傳統的“更多數據、更多計算”的策略可能不再奏效,人工智能的發展將不再依賴於簡單的擴展,而是需要新的架構和理念來突破現有侷限。
在自然語言處理(NLP)領域,斯坦利認爲當前廣泛應用的Transformer架構已經接近瓶頸。雖然Transformer已經極大地推動了AI的發展,但爲了實現超越人類智能(AGI),現有的架構可能無法提供足夠的支持。
因此,未來可能需要對現有架構進行根本性修改,或者開發全新的架構,以便捕捉那些現有模型無法處理的智能特徵,特別是涉及時間演化和創新性判斷的複雜過程。
斯坦利說,AI當前表現出的“幻覺”並不等同於創造力。他提出了“創造性錯覺”的概念,認爲AI的“新想法”通常只是對訓練數據的再現,而非真正的創新。當前技術無法有效區分已知與未知,解決幻覺問題是實現真正創新的關鍵。
關於如何應對大模型幻覺問題,斯坦利談道,OpenAI和中關村科金的實踐經驗值得借鑑。OpenAI通過擴大模型參數規模和強化學習提升推理能力;中關村科金結合高質量的領域知識和數據,開發了更爲專業的領域大模型應用。這些方法有效減少了大模型的幻覺問題,並推動了模型在實際應用中的表現提升。
在多模態技術方面,斯坦利說,雖然GPT-4o等多模態模型在圖像和視頻處理上取得了進展,但這種進步並未帶來智能本質的飛躍。多模態技術並不是通向AGI的唯一途徑。要實現人類水平的智能,推理能力、創新性和複雜信息處理等因素可能更爲關鍵。
四、信通院曹峰:優化Agent工作流,提升任務準確性
中國信通院人工智能研究所平臺與工程化部主任曹峰分享了對AI Agent技術的應用思考。
在Agent的能力方面,曹峰說,Agent不僅需要具備多模態感知和多任務決策的能力,還必須能夠在少量樣本的情況下進行快速泛化。這使得Agent能夠在不同場景中有效工作,尤其是在數據稀缺的情況下仍能做出精準的判斷和決策。
他還談道,優化Agent的工作流是提升大模型應用性能的重要途徑。例如,通過在代碼開發場景中優化Agent工作流,準確率從40%提升到90%以上,證明了合理設計工作流能夠在模型能力達到上限時,進一步提升任務準確性和輸出質量。
關於未來發展,曹峰提出了大模型與小模型結合應用的前景。在這一組合模式中,大模型負責複雜任務的規劃與拆解,小模型專注於執行具體任務。通過這種方式,不僅能降低整體成本,還能提升系統的性能與可解釋性。
Agent的泛化性和魯棒性仍然是當前的技術瓶頸。如何增強Agent對新環境的適應能力和在多變條件下的穩定性,將是未來研究的重要方向。
此外,Agent之間的互操作性也帶來了數據安全與責任歸屬的問題。如何確保Agent的安全使用,並明確責任歸屬,將是行業廣泛應用Agent技術的關鍵所在。
最後,曹峰談道,大模型的應用正在從單一的對話接口,逐漸擴展到包含知識庫、智能調優、微調能力、以及多Agent協作等高級功能的綜合服務形態。這種多極服務模式標誌着大模型應用的深度與廣度正在不斷增加,未來將呈現出更多創新的應用場景。
結語:得助大模型平臺2.0推動企業智能化轉型
得助大模型平臺2.0的發佈,不僅提供了從算力調度到應用部署的全鏈條解決方案,也迴應了行業對實際可用、可持續大模型平臺的需求。
然而,技術的突破不止於此,如何在大模型時代,打破當前技術瓶頸,仍需依賴架構創新和不斷的實際應用積累。