大廠環伺、DeepSeek崛起 大模型“六小虎”走向分化|2025年展望

《科創板日報》1月1日訊(記者 李明明)臨近2024年年末,大模型領域掀起新一輪融資熱潮。12月23日,階躍星辰宣佈完成數億美元B輪融資;12月17日,智譜獲得新一輪30億元融資。

財聯社創投通-執中數據顯示,2024年以來,全市場AI及大模型相關項目共發生270起投融資事件,涉及項目公司217家,參與投資機構495家,可統計到的融資金額達413.98億元人民幣。

其中吸金能力最強勁的,無疑是幾家頭部大模型項目。但隨着項目估值持續走高,而商業化能力尚無里程碑節點出現,明年大模型及AI領域的發展引發行業內外關注。

事實上,一些投資人的態度已經發生了微妙的轉向。英諾天使基金合夥人、北京市前沿國際人工智能研究院理事長王晟告訴《科創板日報》記者,“2023年沒投大模型的投資人很焦慮,而2024年投了大模型的投資人更焦慮。”

他表示,大模型企業耗資大,落地場景和賺錢能力未被證明,AI能力有提升空間,導致後續融資有較大不確定性。“目前多爲國資投資,但國資資金也有限。”

一位匿名投資人對《科創板日報》記者預期,明年大模型及相關企業融資難度或較大。另外能接盤的資本也非常有限,“大模型企業可能更多尋求中東等國外資本,但實際融資金額和宣傳可能存在差異,比如,國資可能會有相應的一些產業落地要求等,如果達不到後期打款或許會設限。”

水木創投合夥人張靜亦告訴記者,2025年以後很難再有同類基礎模型企業進入這個賽道,新入局者很難拿到融資。未來的發展主要是基礎模型和行業結合,尋找商業化落地的途徑。

“在垂直領域有可能會率先跑出一批商業化企業,所以圍繞垂直領域應用可能會出現新的機會,並且成爲投資機構的關注熱點。”

除了在融資能力上的表現分野,在業務上,經過2024一年的洗牌和分化,大模型“六小虎”也走到分水嶺,有的企業堅守基礎模型研發,有的則轉向垂直應用領域。與此同時,厚積薄發的大廠如字節等,開始強勢崛起,裹挾流量、算法等優勢,從To B和to C兩個領域碾壓創企。

王晟表示,就大模型企業的發展而言,目前的幾家頭部創業項目,未來將面臨來自大廠的更激烈的競爭。“在大模型能力方面,在海外OpenAI和Anthropic這樣的Startups(創業公司)強於谷歌、蘋果、Meta。而國內則是字節的豆包、阿里的通義明顯強於六小虎。”

2024年被公認爲是AI應用元年。儘管,Agent等概念引發了二級市場的巨大想象,但爆款級AI超級應用是否會出現的懸念,仍然留到了2025。

對此,王晟認爲,如果 O3 範式(O3模型是OpenAI推出的新一代AI推理模型)能在垂類大模型上跑通,明年就非常有可能在編程和PC/手機界面操作這兩個領域中產生超級 Agent。

大模型“六小虎”,誰來接盤?

據《科創板日報》記者統計,大模型“六小虎”(零一萬物、MimiMax、百川智能、智譜、階躍星辰、月之暗面),今年均獲得了億元級融資,大模型項目在一級市場吸金超過200億元。其中,智譜、月之暗面、百川智能估值已超200億元。

“吸金”能力最強的是近日深陷仲裁風波的月之暗面。2024年初,阿里投資月之暗面近8億美元;今年8月,月之暗面再度收穫大額融資,躋身估值超200億元的國產大模型獨角獸之列。

智譜則已經完成至少12輪融資,投資方包括北京市人工智能產業投資基金、社保基金中關村自主創新基金、美團、阿里、騰訊等多家知名投資機構。

百川智能則在去年7月底完成了50億元人民幣的A輪融資,投資方集齊北上深三地國資。

從大模型“六小虎”今年的融資情況來看,當前,選擇出手大模型項目的資方出現從市場化VC轉向大廠和國資系基金的趨勢。

積極出手的國資中,北京市人工智能基金是典型代表。該基金成立僅一年,但出手頻繁,目前爲止共投資了超過30個項目,涵蓋了北京市一衆大模型產業鏈和具身智能企業。

關於接下來融資趨勢,水木創投合夥人張靜告訴《科創板日報》記者,政府會持續支持AI行業的發展,國資背景資金和大機構資金會持續投入,最終一定會有一到兩家企業緊跟海外的對標企業,但同時國內企業的競爭將更加激烈。“基礎模型是未來AI的基座,也是大家搶佔的制高點,但未來可能只有一兩家能夠活下去。”

匿名投資人則對《科創板日報》記者表示,如今頭部大模型企業估值被擡得很高,能夠持續投資的機構只有少數。目前來看,國資還願意持續加註,但與市場化機構純粹關注資金回報不同,國資還有其他目標和訴求,可能涉及相關業務目標的置換,“若未來大模型發展不及預期,無法達到國資在推動產業發展等方面的訴求,那可以持續給予大模型創業項目資金支持的資方就更少了。”

中東資金以及海外明星風投機構或許是一個可選項。今年,中東石油巨頭沙特阿美旗下Prosperity7基金就參與了智譜的融資。事實上,海外大模型獨角獸的投資方中也頻見中東資金的身影,如沙特投資公司Kingdom Holding、由阿聯酋主權基金穆巴達拉和G42擔任創始合夥人的科技投資公司MGX等。此外,軟銀也一向是人工智能領域的積極投資方。而衆所周知,軟銀旗下的兩隻願景基金,背後的出資方也有很大一部分來自中東。

上述匿名投資人也告訴《科創板日報》記者,智譜對中東資本的引進,一定程度上說明,當前市場環境下,可以承接大模型項目高估值的投資方已經不多了。“國資之後,引進中東資本的做法或許是一個方向。**“但在商業化方面,國內幾大頭部大模型廠商目前始終沒有交出較爲滿意的答卷,這一波大模型融資行情也許即將見頂”。

作爲垂直大模型創企代表,深勢科技創始人、CEO孫偉傑對《科創板日報》記者表示,大模型企業的錢主要燒在硬件成本上,主要包括購置和維護高性能計算設備(如GPU、TPU、CPU集羣等)的費用,其次還有能源和其他。

“雖然過去一段時間,融資市場確實受到了來自不同方面的影響,但是大模型企業,或者說以大模型,尤其是以通用大模型爲主要發力點的企業數量陡增,但是質量參差不齊。融資是一個雙向,甚至多向的選擇,我們堅信,只要產品好、團隊好、前景好,能瞭解真需求解決真問題,包括資本在內的社會各界都是能夠看到的。”

孫偉傑表示,所有大模型入局者都會面臨行業競爭加劇的情況,“技術迭代緩慢或商業化受阻這兩點是很多大模型公司面臨的具體問題,如果不能解決好這兩個問題都有可能被淘汰。”

在市場對大模型後續融資存疑的同時,12月30日下午,上海國投公司與徐彙區共同發佈上海大模型基金。該基金重點關注基礎大模型、垂類大模型,基金首關規模10億。這被行業視爲是國資對大模型領域的持續支持。

而在各地國資以及政府資金對大模型項目支持的背後,也有地區之間對新興產業的搶灘與競逐。

《科創板日報》記者注意到,目前大模型項目呈現出地域聚集趨勢,在“六小虎”中,北京擁有4家:智譜、月之暗面、百川智能、零一萬物;上海擁有兩家:階躍星辰、MiniMax。行業內甚至出現“北智譜、南階躍”的說法。

有知情人士向《科創板日報》記者透露,城市之間對大模型創業企業的爭奪激烈。“有城市直接放言要通過大手筆投資,將頭部項目的總部招引至當地。因爲大模型代表最先進的AI能力輸出,也代表新質生產力,所以地方政府對此非常看重。可以說,大模型及背後資金的競爭,在某種程度上,已經上升到了城市發展戰略及產業規劃之爭。”

大廠強勢緊逼,新勢力重新洗牌

業務上,“六小虎”的路線也逐漸開始洗牌和分化,開始呈現出更清晰的市場格局。

在“六小虎”中,領軍者智譜的To B(面向企業)定位依舊明確,並跑在了行業領先的位置。同時今年以來,公司也在加大對to C市場的開拓。

據智譜方面向《科創板日報》記者介紹,2024年智譜業務保持高速增長,商業化收入增長超過100% ,尤其是智譜推出的MaaS開放平臺 bigmodel.cn 迎來高速增長,即使在堅持API價格普惠的情況下,MaaS平臺的API年收入同比增長超過30倍,日均Tokens消耗量增長150倍。目前,MaaS平臺已經吸引了70萬企業和開發者用戶。

C端產品方面,智譜清言App擁有超過2500萬用戶,年化收入(ARR)超千萬。據介紹,清言可以通過文本、圖像、音頻、視頻來進行多模態互動,是擁有最全模態的AI助手。

11月29日,智譜宣佈升級AutoGLM並開放內測,並將儘快上線成爲面向C端用戶的產品。

匿名投資人告訴記者,目前大模型企業的To B業務中,不少單子來自於政企項目,“但目前這塊競爭正在加劇,後續業務穩定性或面臨考驗。

他表示,To B業務的“代價”之一,是捲到極致的價格戰。以智譜爲例,其模型調用價格已降低到幾近行業最低水平,如GLM-4-Flash的價格僅0.06元/百萬tokens。而這種降價策略,則導致利潤空間進一步被壓縮。**

另一明星獨角獸月之暗面拳頭產品Kimi在C端爆火,甚至在二級市場還掀起了Kimi概念股的投資熱潮。To C走到極致的月之暗面,今年初還推行了出海戰略,但出海業務的發展並不如月之暗面所預期。

此前有接近月之暗面的知情人士對《科創板日報》記者透露,月之暗面的出海項目在今年6月就已經撤掉。“公司目前還是更聚焦於Kimi產品的開發,認爲現階段提升智能能力更重要。”爲了這一目標,月之暗面還在今年8月將微軟亞洲研究院前首席研究經理招至麾下。

To C出海成績斐然的MiniMax,今年亦歷經曲折。其旗下產品Talkie,在海外市場一直表現出色,在2024年上半年成爲美國下載量第四的人工智能應用,前八個月全球下載量已達到1700萬次。

但12月中旬,Talkie被蘋果應用商店下架,直至目前在蘋果應用商店Talkie仍無法被搜索到。

知情人士對《科創板日報》記者表示,目前,海外監管正在加強對社交類APP的審查,“Talkie可能存在違反蘋果公司相關政策或海外政府的監管政策。”

他對記者分析,情感陪伴類APP在海外面臨不健康內容等挑戰,此外,儘管Talkie已經跑出了競爭優勢,但其應用場景創新目前來看有所欠缺,後續也面臨用戶活躍度趨於平穩、新用戶留存率下滑等問題。或難以支撐其目前的高估值。據公開信息,目前Minimax估值達到25億美元,距離200億元俱樂部僅差臨門一腳。

不過,遭遇逆風的MiniMax在2024年也取得了多方面的進展。8月31日,其發佈了基於MOE+Linear Attention的新一代模型技術。

百川智能作爲一個通用基礎模型研發商,在商業落地上,則跑出了垂類模型的趨勢。

作爲唯一專注醫療方向的大模型創業公司,百川智能聚焦AI大模型技術在醫療領域的研發和應用。據悉,Baichuan3大模型在預訓練階段構建了超千億token的醫療數據集,涵蓋醫學文獻、病歷資料等,提升了模型在醫療領域的專業度和知識深度。

其依託通用醫療增強大模型打造的AI健康顧問,在2024世界人工智能大會上首次對外展示。它能像全科醫生一樣與用戶交互,根據用戶症狀持續提問,綜合判斷病因並給出診斷結果和用藥建議。

但對於百川智能的戰略規劃,上述知情人士對《科創板日報》記者表示,“目前來看,百川模型產品尚未跑出PMF,上線後情況未知,且百川如今估值較高,作爲一個通用基礎模型卻往垂直領域發力,業務模式或難以支撐其高估值。”

階躍星辰在“六小虎”中一貫低調。但從目前公佈的情況來看,其技術能力不俗。截至2024年12月,已發佈11款自研基座模型,涵蓋千億參數到萬億參數,從語言到多模態,從理解到生成的全方位能力。

在業務方面,其與金融、內容創作、智能終端等領域的衆多企業展開深度合作。如與上海報業旗下界面財聯社聯合創辦了大模型科技公司財躍星辰,推出金融行業垂直大模型Finstep和C端私人財富助理“小財神”。

匿名投資人對《科創板日報》記者透露,“階躍星辰背後有來自曠視科技方面的支持,且上海方面也一直很重視這家企業。”

雖然零一萬物與其他小虎相比較爲沉寂,並經歷了高管出走的動盪:其核心成員李先剛離職,返回房屋交易平臺貝殼任職;此前其另一位核心成員黃文灝被確認已加入字節跳動。但是,其也在2024年取得了一些進展,其5月推出閉源模型Yi-Large;10月發佈Yi-Lightning模型,在lmsys榜單上排名全球第六 。

值得一提的是,大模型競逐下半年陡生變局。原本顯得有些不溫不火的大廠開始強勢發力,而看起來與人工智能關係不大的一家量化私募機構,成爲了行業內外的關注焦點。

這家機構即是幻方量化。近期,其發佈的DeepSeek V3在多項評測成績上一舉超越阿里Qwen-2.5與Meta Llama 3.1。業內有人認爲,DeepSeek事實上已經可以和“六小虎”併成爲“七強”。

大廠方面,則有近期強勢崛起字節跳動旗下的豆包大模型。儘管豆包在2023年9月才姍姍來遲,但其以驚人的速度躋身全球前列:11月全球月活躍用戶數(MAU)達到5998萬,僅次於ChatGPT,位列全球第二。

豆包之所以異軍突起,最大優勢或是背靠大廠對流量渠道的掌控。據AppGrowing數據,2024年以來,豆包等產品已累計投放超過625萬條廣告,投入金額達到15億元。

智源研究院副院長兼總工程師林詠華告訴《科創板日報》記者,互聯網大廠大模型在技術能力上有兩方面的優勢。一方面,語言模型需要更多的用戶使用,才能起到數據飛輪的作用,互聯網大廠有很強的流量優勢。

另一方面,文生圖、文生視頻方面,字節、快手的優勢在於,他們本身有短視頻平臺,積累了相關的高質量的數據,會比其他的非互聯網廠商有明顯的優勢。

面對巨頭的全面進攻,大模型創企的未來面臨不確定性。

預計2025年會出現更多新的多模態模型

可以看到,整個2024年,國內外都在明顯加快了多模態大模型、AI助理智能體等落地的步伐。

AutoGLM便是智譜此前出圈的AI助理(AI Agent)。據介紹,迭代後的AutoGLM支持自主執行超過50步的長步驟操作,也可以跨APP執行任務,手機、PC、網頁端均有相應版本。《科創板日報》記者從知情人士處獲悉,智譜AutoGLM去年10月就已立項。

對於Agent今年陡然上升的熱度,智譜CEO張鵬告訴《科創板日報》記者,去年Agent討論量較少主要是模型能力還不足,效果並不理想。現在,隨着技術進步和關注度的提高,軟件、硬件廠商也越來越多地參與適配。因此,這兩個條件的滿足讓Agent更有落地可行性。**

智源評測則發現,2024年下半年大模型發展更聚焦綜合能力提升與實際應用。多模態模型發展迅速,涌現了不少新的廠商與新模型,語言模型發展相對放緩。

林詠華告訴《科創板日報》記者,預期2025年,基於語言模型會產生更多的Agent。圍繞Agent做更復雜的AI應用和系統,也會是明年的熱點之一。以及,預計會有更多新的多模態模型。

林詠華表示,首先,現在最優秀的語言模型已經發展了一定的基礎能力,再明顯的增長不是特別容易,不能只是拼更大的參數或更多的數據這條路,而是需要更多的深入創新才能提升,因此,會看到更新更大的語言模型出現的頻率有所減緩,可以說現在進入了語言模型的深水區。

應用落地的硬件方面,近期,百度、Rokid、影目科技、億道信息等紛紛發佈AI眼鏡相關產品,多家國內科技企業也宣佈將在2025年1月7日至10日舉行的國際消費電子產品展覽會(CES2025)發佈AI眼鏡新品。“百鏡大戰”已悄然上演。機構預測,AI眼鏡已成爲智能穿戴市場新風口,有望引領下一代終端革命。

此外,在垂直模型側(如醫療、化學、教育),國內目前也是百花齊放,孫偉傑表示,科學大模型是大模型的垂直領域應用,包括藥物研發、材料科學、氣候預測等方向。與通用大模型不同,科學大模型更關注領域知識與AI技術的深度結合,在特定行業中具有高附加值和強商業潛力。

“未來,通用大模型與垂直大模型都會共存,通用大模型仍將在數據處理、語言生成等廣泛場景中佔據主導地位。而科學大模型在垂直行業領域肯定會進一步細化,在科學研究、醫療、製造業等專業場景中發揮更大作用。” 孫偉傑說。

端側AI也成爲了不少創業企業的選擇。面壁智能聯合創始人、CEO李大海告訴《科創板日報》記者,“2024年下半年,行業突然形成新共識:更高知識密度的小模型和端側智能,成爲大模型發展的新階段。”而面壁智能則從去年年底就開始轉向端側AI。

“如今,因爲端側智能發展的深刻影響,主流消費電子和新興硬件正演變成一個個在不同場景、執行特定任務的超級智能體,成爲新一輪科技創業大風口。”

王晟對《科創板日報》記者分析,當前大模型應用缺乏新計算設備(即手機、電腦之外的新設備)帶來的新場景,在手機和電腦上的應用場景受限,尚未出現令人眼前一亮的原生或殺手級應用,比如新一代類似微信、拼多多、美團、字節跳動級別的應用。“目前的AI應用多是對現有業務的AI增強,但未達最理想狀態。”