沉澱、追趕、爆發,時代浪潮中的中國AI企業

最近結束的聯合國大會上,馬斯克與近期熱點人物、以色列總理內塔尼亞胡談笑風生時,再度盛讚了中國的AI實力:

“至於你說的哪些國家將在人工智能領域處於領先地位?中國肯定是其中之一,是頂尖國家之一,並且有潛力成爲第一。”

雖然馬斯克出名是因爲搞製造業,但作爲OpenAI的早期牽頭人、也是給Google和DeepMind牽過線的內行,馬斯克對AI的理解和參與比一般人想象中深的多。對於中國AI產業,“馬建國”自然洞察敏銳。

馬建國出席上海的世界人工智能大會

距離ChatGPT誕生不過一年不到的時間,僅1-7月,中國就誕生了64個大模型,累計大模型數量達到130個,超過美國的114個[1]。

不過,馬斯克認爲中國有潛力成爲第一,原因一定不只是中國的大模型數量。在轟轟烈烈的百模大戰後,應用層面的建設已經徐徐鋪開,在這關鍵的第二槍上,中國企業其實已經率先站上了起跑線。

誰來打響第二槍?

2022年11月,ChatGPT的問世讓生成式AI在短短一個月裡,成爲了科技圈一整年甚至今後幾年的頭號關鍵詞。

這樣的情形一度讓人回憶起2016年,AlphaGo以碾壓之勢戰勝人類圍棋冠軍李世石,給普羅大衆帶來的震撼和隨之而來的資本狂歡。

AlphaGo 3:0戰勝李世石

有了基於transformer的大模型開道,AI以更符合人類想象的方式到來:可以對話,可以思考,可以像朋友、師長、同事、助手。人們會對AlphaGo的智能產生天然的敬畏,對ChatGPT卻更多的是好奇、興奮,確信AI將會改變我們的生產和生活。

更清晰的藍圖,給了人們前所未有的憧憬,帶來的是扎堆開發大模型的熱鬧場面,連坐擁石油的沙特阿拉伯都坐不住了,意圖要用“鈔能力”堆出一個生成式AI的未來。

在這樣的背景裡,中國不出意外的成爲了大模型開發的主力軍。除了數量上的領先,國內大模型的質量參數也保持了高水準:年初至今,不斷有機構以不同的指標對ChatGPT和國產大模型做測試,一個可觀的趨勢已經出現:

年初還與ChatGPT有較大差距的國產大模型,正在以驚人的速度縮小差距。

在今年5月發佈的中文通用大模型綜合性評測基準SuperCLUE中,科大訊飛推出的星火認知大模型排名全球第三,僅次於GPT-4以及ChatGPT採用的GPT-3.5[2]。

而在10月24日的發佈會上,科大訊飛進一步迭代推出了星火認知大模型V3.0,根據國務院發展研究中心的國研經濟研究院的橫評報告,星火認知大模型V3.0綜合能力超越ChatGPT,國內領先、國際一流。科大訊飛年初時定下的計劃——全面對標ChatGPT,得到兌現。

而相比大模型本身在理論性能與技術路線上的差距,當下產業界最關心的問題,其實是困擾AI產業十幾年,如今再度被搬上臺面的“緊箍咒”。

9月,知名投資機構紅杉資本的David Cahn發佈文章稱,如今的AI產業還需1250億美元的營收,才能掙回爲了大模型在GPU、數據中心、能源等成本上的投入。但目前AI在應用層面上的創新與商業化前景,與1250億美元的閾值還有巨大的分歧。

雖然文章發出馬上就引來了a16z的反駁,但雙方爭議的核心在於計算方式,對“AI應用的創新還不夠”這一點卻達成了共識:大模型是生成式AI的基建,但做好了基建,如何在此基礎上建設應用的高樓大廈實現變現,是這場競賽的第二槍。

如何讓更多“高樓大廈”在大模型的地基上拔地而起,正是中國在生成式AI的賽道上,實現反超的最大機會。

主流觀點認爲,生成式AI應用中存在幾個問題:一是生成能力的可信可靠問題,二是信息的動態集成問題,三是數據耗盡帶來的數據獲取問題[3]。生成能力的可信可靠,需要技術端長時間的迭代和優化,無論什麼國籍的大模型都有很長的路要走。

而後兩個問題的核心矛盾,其實在於數據資源。在這一點上,中國的優勢其實更加明顯:

互聯網被視作數據的蓄水池,而中國擁有全球最大的網民規模,英特爾此前估算,中國產生的數據量大約佔據全球總數據量的五分之一[4]。同時,中國社會的“數字化程度”相比其他主要經濟體要高得多,得益於繁榮的通信基建和各類互聯網應用。在小模型時代,中國就在AI應用落地上領先全球。

另一個優勢則常常不被普通人注意。加州大學伯克利分校的教授Mark Nitzberg曾在一次訪談中,對比了中美在AI應用落地投資上的差異[5]:

在美國,一家AI初創公司需要在營銷上投入巨資,期待產品“一炮而紅”然後回本,非常像一種賭博。但在中國,政府層面的產業政策非常成熟,地方政府也會通過基金等更現代化方式入場投資。同時,大量政府訂單爲AI應用落地提供了緩衝空間。

在紅杉的報告裡,他們將生成式AI的發展劃分爲兩個章節,第一章是“人們發現了生成式AI”這個工具,第二章是“客戶支持”——即應用落地。如今的市場,正是兩個章節切換的窗口期。

而打響第二章節的第一槍的,很可能是中國面孔。

前浪、轉機、開幕

既然聊到AI的應用革命,很難讓人不聯想到上一輪AI熱潮。ChatGPT之前,最符合人類對AI想象的應用是語音助手,也是死在AI應用沙灘上的第一批前浪。

2018年,還未改名爲Meta的Facebook宣佈,下線其AI語音助手Facebook M的人工輔助版,最終享年不到3歲。雖然增強版仍可通過別的方式使用,但僅向居住在加州的大約2000人開放。但在上線之初,扎克伯格曾對Facebook M視作公司的給予厚望,視作公司未來增長的另一支柱。

然而事與願違,Facebook M最終成爲了教科書中的反面案例。事實上,谷歌、微軟以及亞馬遜的語音助手都曾經遇到過類似的困境。

曾經意氣風發的扎克伯格

問題出在哪?簡單來說,就是智能了,但還不夠智能。而根本上,是小模型在應用層面的尷尬。

在大模型誕生前,業內的AI應用大多是基於小模型,只能處理單一任務。面對複雜任務,往往需要拆分成小任務,針對每個小任務去訓練模型。傳統的語音助手通常都是多個小模型的疊加,只能回答預設領域的問題。比如,傳統語音助手可以告訴你“明天是什麼天氣”,卻很難回答“C羅梅西誰的統治力更強”之類從未學習過的問題。

因此,Facebook M時常被詬病,使用說明極其冗長複雜,任務執行範圍卻極其有限。

這還只是產品體驗層面的尷尬。在真正落實到提高人類生產力方面,尤其是遇到生產流程繁瑣的情況,十個步驟需要訓練十個模型,又涉及到成本和效率的拉扯。因此在2019年,AI行業凜冬到來,融資金額像氣球漏了氣,縮爲前一年的1/10。無法創收的初創企業,存活下來僅有巔峰時期的1/20,其中九成處於鉅虧狀態[6]。

但隨着Transformer推開了大模型時代的大門,AI應用的轉機出現了。

transformer模型

相較於小模型,大模型更大規模的神經網絡,換來了極強的通用能力,開發者沒必要再一一找對應的數據做訓練。比如基於ChatGPT的語音助手,不僅可以回答“明天的天氣是否適合出行”的問題,還可以幫忙蒐集資料、規劃項目流程、做會議紀要,還可以像個導師一樣給出學習、工作的意見指導,甚至是做心理輔導等。

這便是大模型帶來的改變,即提供完整、可靠的問題解決方案,真正意義上具備了一定的智能,而不只是更有效率的方案執行者。

更重要的是,大模型突破性地發展出了啓發式對話和長期記憶的能力——它不再只是預設好的機械,而是真正意義上具備了一定的智能。因此,大模型將有機會發展出更深層次的應用,進一步重塑人類社會的科技樹。

科大訊飛在AI健康助手這一應用上的突破就是個典型案例。

2015年底,科大訊飛依靠小模型打造出了訊飛智醫助理,試圖讓人工智能技術與醫療行業相結合。從今天的視角來看,訊飛智醫助理的能力邊界、應用場景主要在B端,爲基層醫生提供輔助診斷。

但隨着大模型時代到來,人工智能顯然可以做得更多、更好。

10月24日發佈會上,科大訊飛推出的新版訊飛曉醫。除原有能力之外,訊飛曉醫還能提供看病前問診功能,幫助有效提升問診效率,健康自查有效度提升40%。還能解答病人的用藥疑問,高風險用藥召回率提升90%,幫助病人更合理地用藥。在此基礎上,訊飛曉醫也支持體檢報告快速生成重點及健康提醒,使得病人可以有針對性地問診。

小模型時代的訊飛智醫助理,主要在B端,是一個基層醫生的助理;相比之下,新版的訊飛曉醫可以將能力邊界延伸到C端,成爲一個私人的健康助手——這一變化,正是大模型所實現的。

值得一提的是,從發佈星火大模型V1.0到現在,科大訊飛實現上述應用的落地,只用了不到半年的時間。這些成果背後,其實是科大訊飛企業價值觀的一種體現:根據地業務的核心滿足社會剛需,以價值創造推動社會進步。這在全球科技公司盲目擴張大模型的當下,有着不小的意義。

有大模型加持的AI,顯然比過去更加符合人類對AI的想象了,大概率不會重走上一輪AI熱潮的老路。大模型革命的第二章節,很可能會比想象中更加波瀾壯闊。

中國企業的十年

人們感嘆中國技術進步之快,卻很少有人意識到,在此之前,中國科企已經伴隨着AI產業走過漫長而曲折的道路。

世界經濟論壇創始人施瓦布教授將工業革命劃分爲四個節點:第一次是蒸汽機的發明,第二次是電氣化革命,第三次是計算機革命,第四次是現在的人工智能革命。

前兩個節點,中國直接沒趕上,第三個節點趕上了,卻只趕上了後半截。

在計算機底層的技術上,先是錯過芯片產業技術轉移黃金期、又是錯過“Win-Tel”聯盟引領的PC浪潮。雖然後來居上,總算坐上了互聯網時代的雲霄飛車;但由於過去缺少對底層技術的投入,因此仍有許多受制於人的地方。

值得慶幸的是,在人工智能的技術革命中,中國公司早早入了場。實際上,論底層技術的積累和前期的投入,中國公司並不比西方落後。

人工智能的上一次里程碑事件是2012年的ImageNet圖像識別大賽:多倫多大學的Geoffrey Hinton團隊拿下冠軍,也爲深度學習的產業化撕開了一道口子。此後,谷歌等極少數美國科技公司加入到了對人工智能的追逐當中,最終開創了一個時代。

但很多人不知道的是,同一年的全球語音合成大賽中,來自中國的科大訊飛團隊也達成了一項成就:它的漢語語音合成超過了普通人水平。從一開始,中國就不乏科大訊飛這樣的“AI原生”公司。

科大訊飛對大模型及其背後深度學習理論的啓蒙,可以追溯到2010年:

當時,微軟AI首席科學家鄧力回母校中科大做了場演講,分享了將深度學習應用於語音識別的最新成果。當時,幾乎沒有什麼人相信深度學習的潛力——連鄧力自己,都是2009年和Hinton合作過一次之後,才變成了“信徒”。然而,這場演講卻給臺下坐着的胡鬱、王智國、劉聰心中,種下了一顆種子。

鄧力

彼時胡鬱是訊飛研究院院長,而王智國、劉聰爲研究院核心成員。

這次講座,成爲了科大訊飛踏足大模型和深度學習的開端。很快在2011年,科大訊飛上線了中文語音識別深度神經網絡系統,是早期中國企業探索AI的經典案例。

此後幾年,越來越多中國的創業者也都意識到了人工智能的價值。語音技術、翻譯、推薦算法等應用陸續涌現,各大廠商基於自身業務和優勢開始擴張。科大訊飛便是AI語音賽道上的重要力量。以2014年啓動“訊飛超腦計劃”爲起點,研發基於類人神經網絡的認知智能系統,正式跨入認知智能時代。

更早涉足大模型和深度學習,帶來的不僅僅是更長久的技術積累,也夯實了中國企業AI人才的建設。AI是個典型的強人才導向型行業,100個大學生未必比得上1個經驗豐富的工程師。

因此,科大訊飛等中國企業很早便開始了這方面的投入。

作爲“大學生創業”的一面旗幟,科大訊飛一直高度重視人才,從最初以同樣位於合肥的中科大爲重心,到一步步與更多院校展開合作,與高校的緊密聯繫,爲科大訊飛源源不斷地輸送着AI人才。

2005年,科大訊飛成立訊飛研究院,但與其他大廠設立的研究院有很大不同:

一方面,整個研究院保留着高校實驗室氛圍,所有人卸下職級,可以就學術問題與董事長劉慶峰“吵架”,總裁吳曉如在重要時刻也得來做後勤。

另一方面,研究院聚集了公司技術研發的所有力量,也就是說,不存在每個業務線養自己技術團隊的現象,也杜絕了所謂“部門牆”帶來的內耗。

而過去十年的無數場硬仗,又進一步加速了這支隊伍的成長與積澱。

例如2013年的“語音識別衛冕之戰”。當時面對來勢洶洶競爭對手,訊飛研究院立下軍令狀,在公司上下的全力支持下,經過三個月的加班加點,成功上線了全新升級的語音識別系統,自此將競爭對手甩在了身後。

也正是有了類似“衛冕之戰”的經驗積累,纔有瞭如今的星火大模型。

去年年底,科大訊飛迅速組建完了團隊並迅速進入攻堅狀態:沒有內部行政級別,上下一條心,所有人扁平化工作,公司高管成了“後勤”,研究院需要什麼就給什麼。最終,從成立專項組、人員調動,到發佈星火大模型,科大訊飛只用了半年的時間。

一方面,這是研究院十幾年文化的延續:看到新技術,立刻撲上去,深度學習如是,大模型如是。而由於是成建制的團隊,可以非常有效地調動資源,可以很快作出成果。另一方面,也是科大訊飛從2010年涉足深度學習至今,十幾年來的持續投資以及最核心的技術積累的結果。

以科大訊飛爲代表,中國企業過往積累的一系列“跬步”,最終換來了今日的“至千里”。

因此,當大模型浪潮的第二幕真的來臨,最終如果真由中國企業打響了第二槍,那也沒什麼好奇怪的了。

尾聲

當2012年Hinton團隊贏下ImageNet圖像識別大賽時,全世界只有很少的商業機構能夠意識到深度學習的價值與產業化空間,即便是學術界,對“深度學習有沒有研究價值”的爭論依然沒有消失。在中國,對人工智能開始大規模投資的公司更是寥寥無幾。

黃仁勳說自己從來不關注市場份額,這是有一定道理的。資本市場和公衆審視科技公司的核心並非銷售額或市佔率,而是他們依然在引領技術的進步,還是開始變得平庸。

在所有以技術和創新作爲關鍵詞的敘事裡,我們都能看見對研發義無反顧的投入、對人才毫無保留的尊重以及對長遠目標十年如一日的堅守。從方方面面看,科大訊飛都在扮演着這個角色。

假使中國公司能夠站在通用人工智能浪潮的前線,科大訊飛沒有理由不成爲主角。

參考資料

[1]IT 2023,賽迪顧問

[2]SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark

[3]大模型發展與落地思考,中國宏觀經濟論壇CMF

[4]2019英特爾中國:公有云和互聯網創新實踐

[5]中國在人工智能產業發展中有哪些優勢?投中網

[6]2021年人工智能行業發展白皮書

[7]AIGC正向醫院滲透,大模型下的AI醫療能否打破僵局?第一財經

[8]AI十年浮沉,與改變命運的大模型,遠川研究所

[9]爲什麼全球AI應用領軍有望產生在中國?求是驛站

作者:何律衡

編輯:陳彬

視覺設計:疏睿

責任編輯:陳彬