中國大模型首次超越GPT-4o 李開復明確表示“絕不放棄預訓練”
21世紀經濟報道記者白楊 北京報道
10月16日,零一萬物正式發佈新旗艦模型Yi-Lightning,這直接回應了外界關於“零一萬物將放棄預訓練模型”的傳聞。
此前,有媒體報道稱,國內六家頭部大模型創業公司中有幾家放棄了預訓練模型,隨後有人將矛頭指向零一萬物。在 Yi-Lightning發佈後,零一萬物CEO李開復明確表示,零一萬物絕不放棄預訓練。
不僅如此,在國際權威盲測榜單 LMSYS 上,Yi-Lightning 的成績超越了OpenAI的GPT-4o(2024-05-13),排名榜單第六,這也是中國大模型首次在該榜單中超越OpenAI GPT-4o。
需要指出的是,Yi-Lightning這次超越的是GPT-4o今年5月份的版本,當時,該版本是全球第一的模型。後來,OpenAI又推出了最新的 ChatGPT-4o-latest,這也是LMSYS榜單上目前排名第一的模型。
做預訓練模型的公司會越來越少
進入2024年以來,中國大模型行業從狂奔進入到了“長跑階段”。
從技術發展上看,在算力受限的情況下,中國基座模型的研發能力處在世界什麼身位,以及如何追趕國外頂尖大模型等問題引發外界關注,甚至一度傳出“中國可以不用再研發預訓練基座模型”的說法。尤其是近期傳出的“頭部大模型創業公司放棄預訓練模型”的消息,似乎也進一步印證了這一發展趨勢。
對此,李開復在接受21世紀經濟報道記者採訪時表示,做好預訓練模型確實是一個技術活,要非常多有才華的人在一起工作,比如需要有懂芯片的人、懂推理的人、懂基礎架構的人、懂模型的人以及懂算法的人,大家一起做才行。
“如果一個公司能有幸擁有這麼多優秀的人才,那我相信中國是絕對可以做出世界排名前十的預訓練通用模型。但是,不是每家公司都可以做這件事情,做這件事情的成本也比較高,所以以後有可能會越來越少的大模型公司去做預訓練。”李開復說。
但他也表示,目前國內六家頭部大模型創業公司的融資額度都是夠的,所以這六家公司只要有夠好的人才、想做預訓練的決心,那融資額跟芯片都不會是問題。
繼續縮短時間差非常困難
按照Yi-Lightning這次取得的成績,零一萬物是在五個月之後超過了五個月前世界最強的模型,這也可以理解爲,中國大模型與美國頂尖大模型的時間差縮短到了5個月。
未來,這個時間差能否進一步縮短?李開復表示,這會非常困難,除非中國公司有一個發明和科技上的突破。
李開復稱,“我不預測我們是不是可以繼續縮短這個時間差,畢竟人家是用10萬張GPU做訓練,而我們用的是兩千張。”
在其看來看,落後六個月不是一個很羞恥的事情,或者一定是要追趕的事情。現在之所以能把時間差縮短至5個月,是因爲中國的模型公司團隊都很聰明,他們能夠快速使用和理解別人做出來的東西,再加上自身的研發特色,比如數據處理、訓練優化等,按照這套方法,時間差能保持在六個月左右,就已經是很好的結果了。
據李開復透露,前段時間他到美國交流,跟OpenAI的人員也有溝通。OpenAI的人跟他說,公司內部還有一些好東西,但是他們不着急拿出來,因爲OpenAI領先行業已經足夠多,到了一定的業務節點才釋放出來,這也是他們能做而別人不能做的。
ToC與ToB的差異化打法
在國內大模型現有的水平下,商業化造血能力也是多方關注的焦點。而無論是ToC還是ToB,模型性能與推理成本——這兩項關鍵因素都直接影響着大模型落地的成敗。
李開復告訴記者,一個大模型公司同時做ToB和ToC非常辛苦,需要多元化的管理方式,因爲兩個團隊的基因不一樣,做事的方法和衡量KPI的方法都不一樣。
而李開復在這兩個領域都有經驗,所以零一萬物也都在試着做,但李開復強調,“絕對不能什麼都做。”
在ToB方面,零一萬物選擇佈局國內市場。“因爲我們找到了一些破局空間,比如用數字人做零售、做餐飲等等,另外我們還有兩三個領域開始在做。”李開復說。
之所以把ToB業務放在中國市場,李開復解釋稱,從全世界範疇來說,ToB供應商基本都是當地的,所以要觸達國外的企業用戶很困難,至少跨國設立分公司做ToB,絕對不是零一萬物這樣的創業公司能做的。
同時,李開復也強調,在國內做ToB業務,也要做有利潤的解決方案,而不只是賣模型以及做項目制。
與ToB業務相反,零一萬物的ToC業務主要佈局海外。李開復表示,首先是因爲,零一萬物剛開始做的時候,國內還沒有合適的中文模型,所以只能在國外先嚐試。而現在,國外的這些產品經過迭代,有些表現得已經很好。
對於國內市場,李開復也在觀察。他認爲,ToC產品在國內走流量有一個很大的問題,即流量成本越來越高。“我們也看到了有些友商的用戶成本,從十幾塊人民幣增長到三十多塊人民幣,近來還有相當的流失,在這樣一個挑戰環境裡,我們會非常謹慎,先不推出中國本土新的ToC應用。”
李開復表示,接下來,零一萬物在國內已有的ToC產品還會繼續維護,同時會把更多的精力放在國外,用更低廉的成本買到更多高質量用戶,或者直接把App賣出去,讓用戶來訂閱付費。