☰

百度版“Sora”，不發模型，直接落地｜最前線

文｜周鑫雨

編輯｜蘇建勳

2024年9月，大廠發佈會扎堆的一個月。而廠商發佈的主要內容，都指向了多模態，和對標OpenAI Sora的視頻生成模型：

9月19日開幕的雲棲大會，阿里雲發佈了通義萬相AI視頻生成模型；緊接着，9月24日，字節跳動的首個視頻生成模型“豆包·視頻生成模型”，空降在火山引擎AI創新巡展。

在快手、阿里、字節等一衆互聯網大廠中，百度佈局通用大模型的時間最早，但對類Sora的視頻生成模型的響應，卻保守的多。迄今爲止，百度尚未發佈獨立的視頻生成模型，2024年1月發佈的視頻生成方法UniVG，仍然留在一紙論文中。

在2024年9月25日舉辦的百度雲智大會上，百度突然發佈了一項文生視頻功能——沒有獨立模型，而是直接在迭代到4.0版本的曦靈數字人平臺上，上線了文生3D數字人、文生3D視頻內容的功能。

根據用戶的文字指令，生成的數字人還能改變妝容、根據落地場景調整形象風格。AI生成功能的嵌入和迭代，讓幾小時的3D數字人生成時間，被壓縮到了5分鐘。

同樣壓縮的還有3D數字人的成本：3D超現實數字人的單價，直接從萬元降到了199元。

以“落地”爲導向的發佈，貫穿了整場百度雲智大會。可見的是，相較於一股腦發佈11款AI應用的2023年雲智大會，百度雲2024年的命題，已經轉變成了向下遊“賣水”。

Scaling Law的探索仍在進行，支撐千億、萬億參數大模型的基礎設施，已經從CPU變成了以GPU爲主，集羣的規模也從千卡擴大到了萬卡級別。

百度集團執行副總裁、百度智能雲事業羣總裁沈抖認爲，大模型的Scaling Law將在一段時間內持續有效，很快就會有更多的十萬卡集羣出現。

最新的百度百舸AI異構計算平臺4.0，就是針對十萬卡集羣的算力管理平臺。一方面，百舸4.0能夠將萬卡任務的有效訓練時長穩定在99.5%以上，另一方面，百舸4.0將萬卡集羣下的萬億參數MoE（混合專家架構）模型的模型算力利用率，提升了30%。

而在模型層，持續的降低價格和使用門檻，依然是百度千帆大模型3.0迭代的重點。迄今爲止，文心旗艦模型的降價幅度已經到了90%，ERNIE Speed、ERNIE Lite兩款主力模型則直接免費開放。

據沈抖介紹，目前文心大模型的日均調用量已經超過了7億次，千帆平臺已經開發了超過70多萬個企業級應用。

在應用層，成爲B端企業用戶的“賣水人”，是百度雲AI應用的定位。會上，除了數字人生成，針對智能客服和代碼編程場景，百度雲分別迭代了智能客服平臺“客悅”和代碼助手“文心快碼”。

更新版的“客悅”已經支持語音、視頻等多模態交互，將智能客服處理複雜任務的能力提升至92%，超過了行業的平均水平（80%）。

目前，代碼處理是AI模型最成熟的應用場景之一，多名從業者對36氪判斷，AI對代碼的理解和處理能力，比長文本更優。

“企業級代碼架構解釋”和“企業級代碼審查”能力，是“文心快碼”上新的兩個功能。前者可幫助用戶理解原有代碼，快速上手開發，而後者則可基於對項目的理解，對代碼進行勘誤。

百度雲在明確提供基礎設施的角色，而對於下游應用層而言，百度CEO李彥宏在會上再次強調，智能體是他最看好的方向：“就像互聯網時代的賬號，智能體門檻很低，但上限卻很高。”

歡迎交流！

相關資訊