大模型·大未來|大模型持續迭代,業內:明年有望在多方面取得突破

12月25日,以“大模型·大未來”爲主題的“2024人工智能大模型基準測試科創發展大會”(下稱“大會”)在成都高新區拉開帷幕。大會匯聚了專家、學者以及多個垂直行業的大模型企業及關聯企業嘉賓,共同探討人工智能產業發展新方向,加速人工智能大模型應用場景落地。

大會現場,四川語言橋信息技術有限公司(以下簡稱“語言橋信息技術”)AI事業部總監李晶在接受採訪時表示,大模型技術在翻譯行業展現出巨大潛力。中科曙光(603019.SH)智能計算產品運營總監唐鵬則向記者表示,在當前人工智能大模型百花齊放的市場環境下,人工智能的發展離不開算法、算力和數據三大核心要素,而在大模型時代,算力需求更是呈現出階梯式增長。

李晶介紹,語言橋信息技術自主研發的先鋒智語(Dtranx)大語言模型,是針對翻譯領域推出的一款大語言模型,專注於解決小語種翻譯的準確性和行業翻譯的專業性問題。她提到,以先鋒智語爲基座的人工智能服務平臺,場景運用涉及到文檔翻譯、圖片翻譯、會議翻譯、實時交流翻譯、網站本地化、軟件本地化、視頻翻譯等。此外,還有更復雜的場景,如法律文件審查、醫學文獻、藥品註冊文件等翻譯,確保專業術語的準確性。通過自動化處理,先鋒智語大幅縮短了翻譯週期,降低了人力成本,顯著提升了整體工作效率和質量。

唐鵬透露,中科曙光目前主要聚焦於toB和toG兩大市場,依託於自主可控的算力基礎,中科曙光提供了自研的DTK軟件棧,該產品不僅兼容CUDA和ROCM,還爲客戶提供了廣泛的受衆羣體。唐鵬表示,中科曙光的算力已經廣泛應用於政府企業、高教科研、運營商、金融能源以及醫療等領域。

從基礎大模型到能落地的行業應用,仍需跨越多重挑戰。

李晶坦言,首先,高質量的數據是訓練高質量模型的基礎。在構建標準化、高質量的數據集時,如何確保數據的安全性和用戶隱私不被侵犯,是一個巨大挑戰。其次,模型的訓練和使用涉及高額硬件投入,且不同行業和企業可能存在大量定製化需求,這要求模型具有高度的靈活性和可定製性,成本控制成爲阻礙大模型應用的重要因素。此外,法律法規遵從和價值觀對齊也是模型應用的難點之一,如何確保模型的生成內容符合對應國家及地區的法規,與人類正確的價值觀對齊,是一個關鍵問題。

對於未來大模型技術的發展趨勢,二人都持積極態度。

李晶認爲,到2025年,大模型有望在複雜邏輯推理和跨領域問題解決方面取得突破,推動行業智能化升級。具體來說,大模型將針對法律、金融、醫療等領域,形成特定垂直領域的高效解決方案;同時,支持跨文檔分析和長期記憶機制,提升複雜任務的連續推理能力;此外,還將專業的翻譯大模型集成到ERP、CRM、CMS等系統,優化自動化工作流和決策支持,爲企業的全球化競爭提供更加強有力的支持。

唐鵬認爲,隨着技術的不斷進步,大模型將持續迭代升級,並在更多行業領域實現落地應用。同時,他也指出,國產化趨勢已然不可逆,未來國產算力將迎來更加蓬勃的發展。他認爲,明年將是國產算力蓬勃發展的一年,市場上將涌現出更多的機會和挑戰。

紅星新聞記者 俞瑤 實習記者 孫樹冠

編輯 鄧凌瑤