☰

對話科大訊飛副總裁、研究院院長劉聰：中國大模型已從追趕對標走向自主原創

出品｜本站科技《態度AGI》對話欄目

作者｜丁廣勝

“從通用AI助手到懂你的AI助手”這是訊飛星火4.0的新口號，“通用”的一詞之差，背後是翻天覆地的變化。

科大訊飛副總裁、研究院院長劉聰說，我們研究院考慮的是“剛需”和“代差”兩個因素，做的事情必須有實際的價值，做每一個研究都要和業務進行對齊，不能閉門造車。

“如果說2023年我們還在追趕、對標、摸索，那2024年我們做的就是場景沉澱。訊飛的邏輯是，底層模型得有，更重要的是找落地價值，帶來工作生活學習的提效，這是訊飛的目標。”

即，通用大模型是訊飛“1+N”戰略的1，是“天花板”立在那裡，而現在需要在場景上面下功夫。訊飛的“1+N”，其中“1”代表通用大模型底座，“N”代表將大模型技術應用在教育、醫療、汽車、辦公、智能硬件等多個行業領域。

對於大模型，目前有兩種聲音，一波人認爲中國很差，一波人認爲中國很強，劉聰說確實我們有些地方還有差距，但我們在相當部分已經很強了，國外很多demo有不少是營銷目的，訊飛在做大模型國產化的相關工作，到了2024年，可以說我們已經摸索出了自己的一條路，開始踏踏實實的做場景、找商業模型了。

那訊飛的產品方法論是什麼？劉聰表示，找PMF（市場匹配度），訊飛基因好、積累好，是厚積薄發，比如，訊飛做了很多年的學習機，家長和孩子接受度很高，原來交互性不強，現在大模型來了，體驗升級，大家樂見其成。

“歸根結底，是找到每家企業自身擅長的地方，做透做紮實，證明自己，有所側重，在國內甚至全球範圍內做到最好，最後找到商業模型。”而做到這一切，我們要有耐心。

劉聰還回應近期熱門的具身智能話題，他認爲，人形雖然很熱，但全面實用化還需要走過正常週期，但大模型帶來了底層能力的提升，在交互能力、知識能力、數據能力上帶來好消息，比如之前是機械臂比較火，而現在大家看到了解決複雜任務的可能性。

而對於大模型和小模型的爭論，劉聰談到，大模型小模型的發展不矛盾，兩種模型是並行發展的，大模型是“天花板”的探索，小模型的核心是根據實際情況和成本來搞定場景。他舉例，訊飛把任務定義爲三類，一般難度的任務，比如翻譯、文字、代碼，中小規模的模型就夠了；中等難度的任務，比如行業深度場景，用中等模型；高難度任務，比如複雜推理，數學場景，就需要用到更復雜的大模型。

談及如果決勝大模型的未來，劉聰談到，第一，關注國際動態，比如我們對於scaling law的進展理解非常清晰；第二，結合實踐，比如在算法方面做測試，結合實踐來做未來判斷；第三，“以我爲主”的賽道聚焦，通用做到第一梯隊之後，做優勢領域，即教育，做深做透。

劉聰還犀利評論OpenAI，他表示，GPT-5底座大模型投入巨大，升級週期會變長，局部亮點可能會不斷出現，但很難有GPT3.5到4那麼大的提升了。

科大訊飛副總裁、研究院院長劉聰與媒體對話精華：

問：訊飛星火V4.0的重點是什麼？哪些地方的升級是關鍵點？

劉聰：我們仍然沿用1+N的路徑，繼續拓展多模態，在底座能力上，重點關注圖文能力，這是訊飛一直以來的特點。

問：訊飛星火V4.0提出佈局AI助手，如何與市面上的產品做差異化？

劉聰：當底座達到一定程度，我們關注的是真正能夠滿足剛需且具有落地價值的產品，這非常關鍵。每個人都應該有一個助手，個性化就變得很重要，真正讓用戶深入使用併產生粘性，這時候他就不願意再用別的產品了。

訊飛研究院並非一個閉門造車的技術研究院，我們所有技術都對應業務需求。

問：訊飛的大模型是如何迭代的？

劉聰：我們一直在摸索scaling law是否符合我們的預期，摸索這條線。但我們更加關注的是模型的場景化，把“N”做透，深入解決系統化問題，這非常關鍵。在多模態中，我將重點關注OCR，以確保OCR做到最好。當然，我們還有國產化的工作需要完成。

問：訊飛在場景落地過程中，如何找PMF（市場匹配度）？

劉聰：大模型之前，訊飛是人工智能企業中較少有的，能夠真正把技術實現產品落地的企業。當年在教育場景下還沒有to c用戶，我們每天與老師們在一起打磨，做到對這個場景非常熟悉，不能僅憑想象和拍腦袋。有了大模型之後，你會發現作文批改比之前厲害很多，除了修改字詞錯誤，還可以處理比喻和修辭方面的問題。

這就是我們找PMF之所以準確，是源於過去25年我們在場景上的積累。這是我們的邏輯。

問：今年具身智能較爲火爆，訊飛也推出了雙足機器人，您如何看待這個機會？

劉聰：在資本界，最近一年多，大模型、人形機器人是最熱的。但站在真正實用化的角度，所有技術發展一樣，仍然需要正常週期。

可以肯定的是，大模型出來後，人形機器人可以做更多事情了，之前都是機械臂，做重複的事情。而現在，處理複雜任務成爲可能。

問：您如何看待“小模型”話題？大家開始更關注小模型可以做的事情。

劉聰：我們一直強調小模型時代，並不意味着不再關注大模型、小模型就足夠了。其實核心技術原理是大模型在更新，大模型先找到天花板，再優化小模型。小模型的不斷進步依賴於大模型的發展。

問：語音轉譯，很多AI產品都具備，訊飛的競爭力在哪裡？

劉聰：首先，通用效果更爲重要，我們涉及到中英文以及其他語種。第二，做到“信達雅”大家都還有很大空間，我們發佈的科研助手已經體現了對學術論文全面翻譯的能力，第三，訊飛擅長語音翻譯、同傳翻譯。後續會有相關新產品和大家見面。

問：從整個產業看，怎麼來定義目前大模型的發展階段？

劉聰：我們現在的狀態是經過兩年對標，正處於厚積薄發的狀態，已經進入了一個需要比拼耐力和耐心的過程。中國大模型已從追趕、對標走向自主原創。

接下來的提升可能在“局部”，Sora非常驚豔，但並沒有像GPT剛出來時的顛覆性。對於訊飛而言，我們的視頻優先級較低，我們需要找到自己的優勢場景和定位，形成自我造血，透徹地提高產品價值。

問：中美大模型差距是否正在縮小？

劉聰：毫無疑問，中美在大模型之間的差距正在縮小，無論是正式的榜單還是實際任務，大家都可以體驗。

問：訊飛星火從2022年12月正式立項到現在一年多了，您個人狀態和之前有什麼不同？

劉聰：相當充實，髮際線依然在。我現在是“首席演示官”，每場“演出”都站在臺前，以前都是在幕後。

關於《態度AGI》

本站科技重磅推出系列對話欄目《態度AGI》。過去三年，AI變革風起雲涌，全球科技秩序正在重構，通往AGI的道路或許正在悄然臨近。本欄目以AGI爲題，將對話100位AI專家、企業家、投資人，試圖撥開雲霧，與大家一道見證AGI時代的到來。第八期對話智譜AICEO張鵬。

往期回顧：

《態度AGI》第一期：對話李開復：大模型創業狂奔一年中美差距縮小我十年不套現

《態度AGI》第二期：對話王小川：我們不跟進大模型價格戰

《態度AGI》第三期：對話戴文淵：大模型價格戰不解決核心問題

《態度AGI》第四期：智源研究院院長王仲遠：GPT4不是國內大模型的盡頭

《態度AGI》第五期：對話朱嘯虎：5年後將沒有獨立的大模型公司存在，因爲沒有商業模式

《態度AGI》第六期：對話梅花創投吳世春：“中國大模型五虎”想要跑出來非常難

《態度AGI》第七期：對話躍然創新CEO李勇：做大模型應用如何和巨頭錯位競爭

《態度AGI》第八期：對話智譜AI CEO張鵬：視頻生成是AGI必經之路，超級App將在“不知不覺”中到來

對話科大訊飛副總裁、研究院院長劉聰：中國大模型已從追趕對標走向自主原創

相關資訊