大模型沒有免費午餐

618的風颳到了大模型圈。僅僅一週,大模型從"釐"時代跨入了"免費"時代。

據統計,此次降價潮共涉及21款大模型廠家。從手機大戰、網約車大戰、共享單車大戰、社區團購大戰,再到後來的造車大戰和如今的大模型大戰。熱鬧的大模型降價潮是否能再次"便宜"消費者?中小企業、雲廠商、大模型廠家,誰纔是真正的贏家?

而隨着降價潮帶來的推理成本的降低,大模型商業化的進程也許加速C端應用的爆發。

01 大模型有免費午餐嗎?

誰也沒想到,大模型降價潮的多米諾首先被一家小公司推開了。

5月6日,幻方旗下DeepSeek發佈的DeepSeek-V2,其價格爲GPT-4-Turbo的近百分之一。5月11日,智譜AI大模型開放平臺也將入門級產品GLM-3 Turbo模型調用價格下調80%。

國內大模型廠商價格戰隨即開啓。5月15日,在春季火山引擎Force原動力大會上,字節主力模型在企業市場定價只有0.0008元/千Tokens,比行業價格低99.3%,讓大模型從"以分計價"進入到"以釐計價"階段。

其他大廠紛紛跟進,5月21日,阿里雲宣佈將旗下通義千問的多款商業化及開源模型進行大幅降價,其中對標GPT-4的商業化模型Qwen-Long的API輸入價格從0.02元/千Tokens降至0.0005元/千Tokens,下降97%;輸出價格從0.02元/千Tokens降至0.002元/千Tokens,下降90%。同時,百度智能雲也發佈公告稱,百度文心大模型的兩款主力模型ENIRESpeed、ENIRElite將全面免費,並立即生效。

騰訊、科大訊飛等廠商也宣佈降價。科大訊飛宣佈訊飛星火API能力正式免費開放,訊飛星火Lite API永久免費開放,頂配版(Spark3.5 Max)API價格爲0.21元/萬Tokens。

又是降價,又是免費,"虧本買賣"的廠商們是要把大模型推向免費時代嗎?

仔細分析下,率先降價的豆包大模型只是降低輸入價格,輸出價格降幅並不明顯。阿里雲降低了輸入和輸出價格,但Qwen-Max的輸出價格並沒有降低,這是千問系列當中參數規模最大、成本最高的模型,百度降低了也是兩款參數規模較小的模型,文心4.0並不在此次降價範疇。大幅降價的都是小規模模型,雖然對外聲稱水平可以對標GPT-4,但實際上連GPT-3.5都不如,模型水平不達標,根本無法在實際的生產環境中運行。

降價的誠意讓人懷疑,看上去像拿幾個不好吃的小菜出來,還聲稱可以免費吃飯。難怪網友懷疑,大模型企業把開發者和企業吸引過來使用,也許就要開始卡調用速度、推理速度、任務處理量等關鍵指標了。"逼你變成vip,再逼你成爲svip"的套路很讓人熟悉。

02降價只是簡單的市場策略

目前,AIGC產業的商業模式主要包括按調用量收費、SaaS(Software as a Service)訂閱收費、增值服務和解決方案等多種形式,覆蓋了從內容生產公司到普通消費者的廣泛客戶羣體。

以OpenAI爲例,其主要收入來源有三:一是針對C端的會員收取訂閱服務費用;二是爲企業端開發者提供API調用服務,通過付費接入OpenAI端口後,B端用戶可在金融、醫療、繪畫等領域調用GPT系列大模型、DALL·E系列文生圖模型、Whisper語音識別模型進行應用開發,這也是OpenAI最核心的業務;三是來自微軟Azure雲服務的分成。憑藉這三項主要業務,2023年OpenAI收入突破了13億元。

由於處於相同的賽道,目前國內大廠的收費模式也基本類似於OpenAI,但無論是C端還是B端,國內大模型發展的瓶頸早已是現實。大模型推理價格的降低,主要是因爲各個廠商爲了搶佔市場份額、加速商業化進程。

一個現實是,國內大模型的使用人數還是太少且用戶增長乏力,使用數據不夠豐富。其次,國內大模型在應用層面,即基於AIGC應用端的用戶數量也不高。因此,通過免費擴大用戶規模,增加用戶交互和訓練數據是這次價格戰的主要目標。

市場普遍認爲,價格戰的本質是國內大模型技術差異不大,用戶難以感知技術上的區分。互聯網大廠通過雄厚的資金,快速削弱和踢出資金實力薄弱的公司。從當年的手機大戰、網約車大戰、共享單車大戰、社區團購大戰,再到後來的造車大戰都是相似的套路,背後都是技術差距過小導致的。

但大模型"價格戰"不只是簡單的市場競爭策略。不少人認爲,降價標誌着國產大模型發展的商業化拐點已到。申萬宏源研究所信息化研究部總監、TMT行業首席分析師劉洋在公開採訪中表示,國內大模型企業重視產業價值優於財務價值,用戶端以及增值版本已經到了可以大規模推廣的時候。科大訊飛在發佈會中表示,當前公司基於國產自主可控大模型工程化優勢,訊飛星火API能力正式免費開放,有利於幫助開發者降低調用成本,驅動產品創新驗證,加速大模型賦能及AI普惠化的到來。

人類每一次技術進步的結果,就是技術成本的不斷降低,大模型同樣遵循着一種"摩爾定律"和規模效應。OpenAI等國外公司早已率先實現了降價,模型能力和算力成本的雙重困境下的國內大模型敢於降價,未嘗不是算力成本下降的結果。

對於堅持做大模型的雲廠商來說,搶佔市場份額之外,更大的算盤其實在公有云市場。

公有云是大模型的技術基礎。OpenAI發佈4o大模型後,引起了社交媒體的一段鼓吹,但亦有專業人士指出,基於Transformer架構下的ChatGpt如果一直依賴公有云,就必然要面對大量用戶使用時低延遲無法得到滿足的現實。

公共雲在生成式人工智能時代神經網絡和啓動機器般基石作用的體現。因此,大模型行業的快速發展,公有云仍然是巨大的獲利方。如果大模型應用真正爆發,AI推理市場也將迎來爆發,打造了具有基座大模型能力的公共雲廠商,通過公共雲+API的模式,才能走出新的增長曲線,獲取更大的盈利空間。以阿里云爲代表的雲計算廠商,通過從底層算力、AI平臺再到模型服務的不斷創新,同時AI也反哺了雲從管理、應用、計算、基礎架構能力的提升。

03槍響之後,誰是贏家

像網約車大戰時用戶能極低價格打車一樣,每次價格大戰都是消費者再次收割紅利的時候,但不同的是,此次大模型的降價也許受益者並不是普通消費者。

一直以來,大模型面臨的尷尬是:用戶增長乏力不可避免,寫複雜的提示詞仍然是普通用戶最大的障礙。目前面向C端的主要是各手機廠商植入式的AI助手,但這些AI工具難以從消費者手中變現。

大模型降價究竟誰能得利?

透過AIGC 產業鏈中各層級關係來看,目前位於產業最底層的是基礎設施層,核心是支撐算力的AI服務器,如CPU、GPU等,這一產業領域以英偉達和AMD爲代表;往上是需要諸多頂尖科學家進行長時期投入的模型層,國外的OpenAI和Google以及國內大廠目前主要在這一領域競爭。基於大模型的應用層,則是致力於解決C端用戶的消費終端以及爲B端用戶提供行業解決方案。

對於大模型行業來說,僅僅具有技術的先進性並不能帶來應用的落地,如果不能降低大模型的推理成本,任何商業化都將是一種昂貴的嘗試,尤其是C端應用,成本可能是個無底洞。

由此可見,大模型全面降價最大的利好仍然是進行應用開發的中小企業,成本的降低有助於這一類企業的百花齊放。

以AI大模型爲技術底座打造具有針對性的應用軟件,最典型的就是今年首個爆火的國產生成式AI產品Remini。醜萌搞怪的黏土風濾鏡,一躍讓Remini直接衝上了國內iOS免費APP下載榜榜首。Remini的爆火讓人們想起了另一款圖像生成軟件妙鴨,僅用9.9元和20張日常照就可以生成自己的"數字分身",效果堪比市場價數百元的藝術寫真。和妙鴨一樣,Remini的結局也許只是曇花一現,和那些不溫不火的AI應用產品一起,讓人不得不對生成式AI的商業化應用路徑及其穩定性擔憂。

所以API貴是限制應用端發展的主要原因嗎?顯然不是。正如阿里巴巴原副總裁賈揚清所言,今天企業在使用AI時,並不是成本驅動的。企業如果搞不清怎樣才能產生業務價值,再便宜也不過是一種浪費。

360董事長兼CEO也公開表示了自己對當下大模型產業的看法。他認爲,公用大模型到應用大模型轉變纔是行業正確的思路。針對C端用戶,需要找到用戶需求進行個性化定製;另一方面爲企業定製專業的大模型並進行私有化部署。"未來的企業內部應該擁有多個垂直大模型,這樣的模型既要簡約又要便於使用,提高企業內部效率。"例如,最近國產自研的聚焦財稅領域的垂類大模型——BPai財稅大模型。

既要抓模型技術,又要抓商業應用,價格戰之後的路還很遠。

"便宜贏得不了商戰,誰能落地獲得利潤纔是笑到最後。"