整體對標GPT-4 Turbo  科大訊飛劉慶峰稱應理性認識大模型綜合差距

本報記者 陳佳嵐 廣州報道

OpenAI最新大模型版本GPT-4o發佈一個月,國內廠商科大訊飛就聲稱旗下大模型已在多方面能力對標GPT-4o了。

6月27日,科大訊飛發佈基於全國首個萬卡算力集羣“飛星一號”的星火大模型V4.0版本,該版本七大核心能力全面升級,其聲稱在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面實現對GPT-4 Turbo的整體超越。

“訊飛星火大模型V4.0是在全國產算力平臺上訓練的大模型,所有算法都是我們自主可控的,每一行碼、每一個數據都是我們自己編寫、自己清洗出來的大模型。”科大訊飛董事長劉慶峰表示,一定程度上,星火大模型V4.0的發佈對完全自主可控的大模型究竟走到了什麼樣的發展階段,具有重要的標誌意義。

“我們多語言的語音識別原來需要1萬小時數據,現在只要100小時數據就能做到比原來1萬小時還好的效果。”劉慶峰表示,在中國,一定要考慮用更小的算力、更小的數據,做出更優質的落地成果,這樣才能夠真正地在未來幾年打贏這一場人工智能紅利賦能產業的“仗”,但同時,整個社會還要加強源頭技術創新的氛圍,一定要看到中美之間的差距,才能夠迎頭趕上,絕不能盲目自信,盲目地認爲我們都已經超越了。差距還是很大的,需要大家有充分清晰而又理性的認知。

核心能力提升 對標GPT-4 Turbo

ChatGPT作爲領先的語言模型代表了當前人工智能領域的先進技術水平,國內大模型總喜歡與之一較高下,這不僅是國內大模型希望通過與ChatGPT競爭提高自身的市場認知度和用戶基礎,背後也是中美大模型差距的較量,還可以減少對外部技術的依賴。

《中國經營報》記者注意到,對於科大訊飛而言,其訊飛星火大模型版本幾乎每次更迭都會與ChatGPT做對比,這次也不例外。OpenAI在上個月(5月14日)剛發佈了最新大模型版本GPT-4o,聚焦語言交互功能的提升,科大訊飛就迫不及待地要和GPT-4o進行PK了。

科大訊飛官方介紹,根據《通用認知智能大模型測評體系2.0》測試結果,訊飛星火V4.0已經實現了和GPT-4 Turbo的全面對標,在文本生成、語言理解、知識問答、邏輯推理、數學這些能力上都已經實現超越。

現場,劉慶峰展示了訊飛星火V4.0在複雜指令、複雜邏輯推理、空間推理、高中數學等方面的效果,星火“智商”再度進化。“複雜指令”現在得到了很好的提升,例如對標題使用修飾手法、需要引經據典的情況以及要用成語等,它都能理解,這就是“複雜指令”的跟隨能力。

然而,科大訊飛也坦言訊飛星火V4.0在代碼和多模態能力上與GPT-4 Turbo還有差距。

劉慶峰表示,代碼能力是我們非常關注的能力之一,因爲它涉及未來的產業信息化和信息產業化的核心。ChatGPT去年2月通過谷歌二級程序員測試,當時的GPT-3.5用這個測試集只獲得了60多分。GPT-4 Turbo今年1月測試大概在80分,現在到86分,也在快速迭代和進步。預計在今年8月,訊飛星火會達到86分以上的水平。

而訊飛星火V4.0多模態能力與GPT-4 Turbo還有所差距,是因爲我們當前在文生視頻上還沒有算力,也是下一步的核心重點,但是有生態夥伴一起做。

認識中美科技綜合差距、長期主義打造自主可控生態

“今天的訊飛星火V4.0對標GPT-4 Turbo是全方位對標,但是我們同時要看到,一旦GPT-5發佈,因爲它的模型尺寸更大、訓練時間更長、數據更多,又會把差距拉開,甚至拉到一年以上。”劉慶峰坦承,,我們一定要科學理性地認識到中美科技的綜合差距。

在劉慶峰看來,中美在通用大模型底座上的差距,是半年到一年半之間的動態追趕,但不會被甩開。

他繼續說道:“我們有信心快速追趕,而且是在完全國產算力自主可控算法和數據基礎上來追趕,保證不出現代差,保證極限情況下,能夠頂上扛上。我們既要認識到差距,又要有充分的信心,要能夠科學理性地給出從源頭技術到生態到產業應用落地的一整套打法,要以長期主義來打造真正自主可控的AI產業生態。”

劉慶峰認爲,面對未來的人工智能新生態,要關注源頭技術生態、智能體生態、應用生態、行業生態。在推動的過程中,一定要實現底座技術的完全自主可控,否則可能我們就把大樓建在別人的院子裡,建在沙灘上,隨時會倒塌,要真正做到軟硬件一體化,才能更深度地落地。

記者注意到,劉慶峰多次強調要打造自主可控的AI產業生態的重要性。

2023年10月17日,英偉達應美國商務部要求,對中國所有能訓練大模型的智能算力全面斷供。近日,OpenAI在官方推送的郵件通知中明確指出,自7月9日起,將開始阻止來自非支持國家和地區的API流量包括來自中國的API申請。

在劉慶峰看來,從英偉達斷供先進人工智能芯片到OpenAI阻止中國地區的API流量,都是中美科技競爭日益激烈背景下人工智能領域的博弈。在這一情況下,到底有沒有自主可控的國產底座能力做支撐,決定了我國大模型在這條路上到底能走多遠。通用人工智能這波浪潮相當於PC和互聯網的誕生,在人類歷史上有深刻的意義,而我們能不能享受這波紅利,能不能成爲美國之後全球智慧涌現的第二極?劉慶峰表示:“只有自主可控的繁榮生態,纔有中國通用人工智能的大未來。”

第三方諮詢機構Gartner稱,到2026年之前,全世界80%的企業都要用到通用AI ,今天這個數字是5%至10%。

很顯然,AI是新一輪科技革命和產業變革的重要驅動力量,將對全球經濟社會發展和人類文明進步產生深遠影響。中國企業要想在這波浪潮中分得大蛋糕,以長期主義打造真正自主可控的AI產業生態是一條重要路徑。

編輯:吳清 審覈:李正豪 校對:劉軍