對話科大訊飛副總裁、研究院院長劉聰:中國大模型已從追趕對標走向自主原創

出品|本站科技《態度AGI》對話欄目

作者|丁廣勝

“從通用AI助手到懂你的AI助手”這是訊飛星火4.0的新口號,“通用”的一詞之差,背後是翻天覆地的變化。

科大訊飛副總裁、研究院院長劉聰說,我們研究院考慮的是“剛需”和“代差”兩個因素,做的事情必須有實際的價值,做每一個研究都要和業務進行對齊,不能閉門造車。

“如果說2023年我們還在追趕、對標、摸索,那2024年我們做的就是場景沉澱。訊飛的邏輯是,底層模型得有,更重要的是找落地價值,帶來工作生活學習的提效,這是訊飛的目標。”

即,通用大模型是訊飛“1+N”戰略的1,是“天花板”立在那裡,而現在需要在場景上面下功夫。訊飛的“1+N”,其中“1”代表通用大模型底座,“N”代表將大模型技術應用在教育、醫療、汽車、辦公、智能硬件等多個行業領域。

對於大模型,目前有兩種聲音,一波人認爲中國很差,一波人認爲中國很強,劉聰說確實我們有些地方還有差距,但我們在相當部分已經很強了,國外很多demo有不少是營銷目的,訊飛在做大模型國產化的相關工作,到了2024年,可以說我們已經摸索出了自己的一條路,開始踏踏實實的做場景、找商業模型了。

那訊飛的產品方法論是什麼?劉聰表示,找PMF(市場匹配度),訊飛基因好、積累好,是厚積薄發,比如,訊飛做了很多年的學習機,家長和孩子接受度很高,原來交互性不強,現在大模型來了,體驗升級,大家樂見其成。

“歸根結底,是找到每家企業自身擅長的地方,做透做紮實,證明自己,有所側重,在國內甚至全球範圍內做到最好,最後找到商業模型。”而做到這一切,我們要有耐心。

劉聰還回應近期熱門的具身智能話題,他認爲,人形雖然很熱,但全面實用化還需要走過正常週期,但大模型帶來了底層能力的提升,在交互能力、知識能力、數據能力上帶來好消息,比如之前是機械臂比較火,而現在大家看到了解決複雜任務的可能性。

而對於大模型和小模型的爭論,劉聰談到,大模型小模型的發展不矛盾,兩種模型是並行發展的,大模型是“天花板”的探索,小模型的核心是根據實際情況和成本來搞定場景。他舉例,訊飛把任務定義爲三類,一般難度的任務,比如翻譯、文字、代碼,中小規模的模型就夠了;中等難度的任務,比如行業深度場景,用中等模型;高難度任務,比如複雜推理,數學場景,就需要用到更復雜的大模型。

談及如果決勝大模型的未來,劉聰談到,第一,關注國際動態,比如我們對於scaling law的進展理解非常清晰;第二,結合實踐,比如在算法方面做測試,結合實踐來做未來判斷;第三,“以我爲主”的賽道聚焦,通用做到第一梯隊之後,做優勢領域,即教育,做深做透。

劉聰還犀利評論OpenAI,他表示,GPT-5底座大模型投入巨大,升級週期會變長,局部亮點可能會不斷出現,但很難有GPT3.5到4那麼大的提升了。

科大訊飛副總裁、研究院院長劉聰與媒體對話精華:

問:訊飛星火V4.0的重點是什麼?哪些地方的升級是關鍵點?

劉聰:我們仍然沿用1+N的路徑,繼續拓展多模態,在底座能力上,重點關注圖文能力,這是訊飛一直以來的特點。

問:訊飛星火V4.0提出佈局AI助手,如何與市面上的產品做差異化?

劉聰:當底座達到一定程度,我們關注的是真正能夠滿足剛需且具有落地價值的產品,這非常關鍵。每個人都應該有一個助手,個性化就變得很重要,真正讓用戶深入使用併產生粘性,這時候他就不願意再用別的產品了。

訊飛研究院並非一個閉門造車的技術研究院,我們所有技術都對應業務需求。

問:訊飛的大模型是如何迭代的?

劉聰:我們一直在摸索scaling law是否符合我們的預期,摸索這條線。但我們更加關注的是模型的場景化,把“N”做透,深入解決系統化問題,這非常關鍵。在多模態中,我將重點關注OCR,以確保OCR做到最好。當然,我們還有國產化的工作需要完成。

問:訊飛在場景落地過程中,如何找PMF(市場匹配度)?

劉聰:大模型之前,訊飛是人工智能企業中較少有的,能夠真正把技術實現產品落地的企業。當年在教育場景下還沒有to c用戶,我們每天與老師們在一起打磨,做到對這個場景非常熟悉,不能僅憑想象和拍腦袋。有了大模型之後,你會發現作文批改比之前厲害很多,除了修改字詞錯誤,還可以處理比喻和修辭方面的問題。

這就是我們找PMF之所以準確,是源於過去25年我們在場景上的積累。這是我們的邏輯。

問:今年具身智能較爲火爆,訊飛也推出了雙足機器人,您如何看待這個機會?

劉聰:在資本界,最近一年多,大模型、人形機器人是最熱的。但站在真正實用化的角度,所有技術發展一樣,仍然需要正常週期。

可以肯定的是,大模型出來後,人形機器人可以做更多事情了,之前都是機械臂,做重複的事情。而現在,處理複雜任務成爲可能。

問:您如何看待“小模型”話題?大家開始更關注小模型可以做的事情。

劉聰:我們一直強調小模型時代,並不意味着不再關注大模型、小模型就足夠了。其實核心技術原理是大模型在更新,大模型先找到天花板,再優化小模型。小模型的不斷進步依賴於大模型的發展。

問:語音轉譯,很多AI產品都具備,訊飛的競爭力在哪裡?

劉聰:首先,通用效果更爲重要,我們涉及到中英文以及其他語種。第二,做到“信達雅”大家都還有很大空間,我們發佈的科研助手已經體現了對學術論文全面翻譯的能力,第三,訊飛擅長語音翻譯、同傳翻譯。後續會有相關新產品和大家見面。

問:從整個產業看,怎麼來定義目前大模型的發展階段?

劉聰:我們現在的狀態是經過兩年對標,正處於厚積薄發的狀態,已經進入了一個需要比拼耐力和耐心的過程。中國大模型已從追趕、對標走向自主原創。

接下來的提升可能在“局部”,Sora非常驚豔,但並沒有像GPT剛出來時的顛覆性。對於訊飛而言,我們的視頻優先級較低,我們需要找到自己的優勢場景和定位,形成自我造血,透徹地提高產品價值。

問:中美大模型差距是否正在縮小?

劉聰:毫無疑問,中美在大模型之間的差距正在縮小,無論是正式的榜單還是實際任務,大家都可以體驗。

問:訊飛星火從2022年12月正式立項到現在一年多了,您個人狀態和之前有什麼不同?

劉聰:相當充實,髮際線依然在。我現在是“首席演示官”,每場“演出”都站在臺前,以前都是在幕後。

關於《態度AGI》

本站科技重磅推出系列對話欄目《態度AGI》。過去三年,AI變革風起雲涌,全球科技秩序正在重構,通往AGI的道路或許正在悄然臨近。本欄目以AGI爲題,將對話100位AI專家、企業家、投資人,試圖撥開雲霧,與大家一道見證AGI時代的到來。第八期對話智譜AICEO張鵬。

往期回顧:

《態度AGI》第一期:對話李開復:大模型創業狂奔一年 中美差距縮小 我十年不套現

《態度AGI》第二期:對話王小川:我們不跟進大模型價格戰

《態度AGI》第三期:對話戴文淵:大模型價格戰不解決核心問題

《態度AGI》第四期:智源研究院院長王仲遠:GPT4不是國內大模型的盡頭

《態度AGI》第五期:對話朱嘯虎:5年後將沒有獨立的大模型公司存在,因爲沒有商業模式

《態度AGI》第六期:對話梅花創投吳世春:“中國大模型五虎”想要跑出來非常難

《態度AGI》第七期:對話躍然創新CEO李勇:做大模型應用 如何和巨頭錯位競爭

《態度AGI》第八期:對話智譜AI CEO張鵬:視頻生成是AGI必經之路,超級App將在“不知不覺”中到來