百度版“Sora”,不發模型,直接落地|最前線

文|周鑫雨

編輯|蘇建勳

2024年9月,大廠發佈會扎堆的一個月。而廠商發佈的主要內容,都指向了多模態,和對標OpenAI Sora的視頻生成模型:

9月19日開幕的雲棲大會,阿里雲發佈了通義萬相AI視頻生成模型;緊接着,9月24日,字節跳動的首個視頻生成模型“豆包·視頻生成模型”,空降在火山引擎AI創新巡展。

在快手、阿里、字節等一衆互聯網大廠中,百度佈局通用大模型的時間最早,但對類Sora的視頻生成模型的響應,卻保守的多。迄今爲止,百度尚未發佈獨立的視頻生成模型,2024年1月發佈的視頻生成方法UniVG,仍然留在一紙論文中。

在2024年9月25日舉辦的百度雲智大會上,百度突然發佈了一項文生視頻功能——沒有獨立模型,而是直接在迭代到4.0版本的曦靈數字人平臺上,上線了文生3D數字人、文生3D視頻內容的功能。

根據用戶的文字指令,生成的數字人還能改變妝容、根據落地場景調整形象風格。AI生成功能的嵌入和迭代,讓幾小時的3D數字人生成時間,被壓縮到了5分鐘。

同樣壓縮的還有3D數字人的成本:3D超現實數字人的單價,直接從萬元降到了199元。

以“落地”爲導向的發佈,貫穿了整場百度雲智大會。可見的是,相較於一股腦發佈11款AI應用的2023年雲智大會,百度雲2024年的命題,已經轉變成了向下遊“賣水”。

Scaling Law的探索仍在進行,支撐千億、萬億參數大模型的基礎設施,已經從CPU變成了以GPU爲主,集羣的規模也從千卡擴大到了萬卡級別。

百度集團執行副總裁、百度智能雲事業羣總裁沈抖認爲,大模型的Scaling Law將在一段時間內持續有效,很快就會有更多的十萬卡集羣出現。

最新的百度百舸AI異構計算平臺4.0,就是針對十萬卡集羣的算力管理平臺。一方面,百舸4.0能夠將萬卡任務的有效訓練時長穩定在99.5%以上,另一方面,百舸4.0將萬卡集羣下的萬億參數MoE(混合專家架構)模型的模型算力利用率,提升了30%。

而在模型層,持續的降低價格和使用門檻,依然是百度千帆大模型3.0迭代的重點。迄今爲止,文心旗艦模型的降價幅度已經到了90%,ERNIE Speed、ERNIE Lite兩款主力模型則直接免費開放。

據沈抖介紹,目前文心大模型的日均調用量已經超過了7億次,千帆平臺已經開發了超過70多萬個企業級應用。

在應用層,成爲B端企業用戶的“賣水人”,是百度雲AI應用的定位。會上,除了數字人生成,針對智能客服和代碼編程場景,百度雲分別迭代了智能客服平臺“客悅”和代碼助手“文心快碼”。

更新版的“客悅”已經支持語音、視頻等多模態交互,將智能客服處理複雜任務的能力提升至92%,超過了行業的平均水平(80%)。

目前,代碼處理是AI模型最成熟的應用場景之一,多名從業者對36氪判斷,AI對代碼的理解和處理能力,比長文本更優。

“企業級代碼架構解釋”和“企業級代碼審查”能力,是“文心快碼”上新的兩個功能。前者可幫助用戶理解原有代碼,快速上手開發,而後者則可基於對項目的理解,對代碼進行勘誤。

百度雲在明確提供基礎設施的角色,而對於下游應用層而言,百度CEO李彥宏在會上再次強調,智能體是他最看好的方向:“就像互聯網時代的賬號,智能體門檻很低,但上限卻很高。”

歡迎交流!