李開復:做大模型要靠長跑,向投資人承諾十年不套現

由李開復擔任創始人兼CEO的大模型創業公司零一萬物,剛剛公佈了自己在百模大戰中的新進展。

5月13日,零一萬物正式發佈千億參數閉源大模型Yi-Large。在斯坦福開源評測項目AlpacaEval 2.0英語能力排行榜上,該模型的LC Win Rate(控制文本長度誤差的勝率)僅次於Open AI的GPT-4 Turbo,Win Rate(勝率)則位列世界第一。

儘管這家公司此前發佈的開源大模型以中小尺寸爲主,但團隊在行動上認可了閉源大模型的價值。李開復還透露,零一萬物已啓動下一代萬億參數Yi-XLarge MoE模型訓練。

過去,大模型領域創業者談得最多的一個詞是PMF(產品市場契合),但李開復認爲這個移動互聯網時期的概念已經難以適應AI時代了。

在移動互聯網時期,用戶規模增長所帶來的邊際成本很低。但到了大模型時代,模型訓練和推理成本是每一個創業公司必須要面臨的挑戰。

“用戶增長需要的優質應用離不開強大的基座模型,而這背後往往是高昂的訓練成本,此外還需要考慮隨用戶規模增長的推理成本。”李開復表示,只有PMF已經不夠了,還需要考慮Technology(技術)和Cost(成本)的匹配。

因此,他提出了一個新概念——TC-PMF,技術成本X產品市場契合度。“做TC-PMF,推理成本下降是個‘移動目標’,這比傳統PMF難上100倍。” 李開復表示。

正因爲如此,李開復不認可目前一些大模型公司買流量推廣的做法。他表示,行業應當共同避免陷入不理性的ofo式流血燒錢打法。

面向下一階段的發展和競爭,零一萬物已經明確的四個方向包括全球化佈局、模基共建、模應一體、Al-First。

全球化方面,零一萬物已在海外上線了4款消費端產品,其中生產力產品線今年預期營收過億元,ROI(投資回報率)達到1,海外生產力應用用戶規模接近千萬。

模基共建主要指自研人工智能基礎架構技術,這樣能從從底層優化訓練方法,提升計算效率。零一萬物該公司稱,經優化後,其千億參數模型的訓練成本同比降幅達一倍。模應一體主要表示基座模型能力要與應用效果體系化聯動。

業界目前頗爲篤定的是,大模型領域很快會迎來應用層的爆發。李開復此前已明確表態,2024年會是AI應用爆發元年。金沙江創投主管合夥人朱嘯虎也已多次公開表示,AI大模型應用層將在2025年迎來爆發。

兩種結論的時間差是否有意義?李開復對界面新聞記者表示,朱嘯虎說得有一定道理。目前推理成本一年降低10倍,兩年就是100倍,如果GPT-4的能力只要以百分之一的價錢來做推理成本,很多應用肯定可以爆發。

“但我認爲今年是元年,因爲有些領域今年就會爆發。”李開復認爲,整個普惠點不是同時來到,有些領域的應用要求會很高。他以生產力工具產品爲例,稱目前已經達到TC-PMF,但還可以更好。

零一萬物一週前發佈了自己面向消費端的生產力應用 “萬知”,目前 開始正式提供服務;面向企業生態的 “API開放平臺”也同步上線。

至於真正的超級應用何時才能出現?李開復表示,團隊已經可以預測Yi-XLarge的訓練完成時間點以及推理能力的增長,內部會有一套方法論,一邊針對階段性成果做最終預測,一邊基於該預測開始打磨產品。

“這個領域速度這麼快,不能等模型做完了再想TC-PMF。”他說,“現在是分秒必爭。”

零一萬物成立一年來,拿到了來自創新工場和阿里雲的兩筆公開投資,估值據悉已超10億美元,是國內大模型領域獨角獸俱樂部的成員之一。

創始人兼CEO李開復似乎也已完全適應投資人到創業者的身份轉變。最近,他剛剛註冊了抖音賬號,並開始有節奏地發佈短視頻。實際上他已經受邀多次,但如今爲了分享自家產品和技術,他清楚“這還是有必要的”。

“我們(中國大模型)狂奔了一年,在模型方面至少趕上美國最頂尖的大模型,當然以後還要繼續努力,但是我們對未來需要有沉澱和展望,不能只是拼命地狂奔,而是要開始思考怎麼進入長跑模式。”李開復表示。

對於這場人生新戰役,他也毫不諱言自己的信心和決心。

“這是我40多年的夢想,在我博士學位申請信裡,我就寫過AGI就是我的夢想。”他說,“至於變現,我確實跟我的投資人一年前做了承諾,就是我十年不套現。”