大模型該往何處去?百度李彥宏:行業存在三大認知誤區

“外界對大模型有相當多的誤解。”近日,李彥宏一則內部講話曝光再次將大衆的關注點轉向了大模型及AI領域。

據稱,在最近一次和員工交流中,李彥宏首次談到了當下行業對大模型存在的三個認知誤區——大模型競爭、開源模型效率、智能體趨勢。

在他看來,大模型的天花板很高,現在距離理想情況還相差非常遠,所以模型要不斷快速迭代、更新和升級。這個過程可能需要幾年、十幾年如一日地投入,才能真正滿足用戶需求,幫助用戶降本增效。

1

關於大模型競爭

榜單不代表真正實力

自去年3月以來,大模型相關領域發展得非常迅猛。很多玩家爲了證明自身的產品好,會在發佈之後打榜、猜測試題目、答題技巧等。在外界看來,榜單上的數據似乎表明各個大模型的能力,已經沒有壁壘。

但李彥宏並不認同這一觀點。他表示,每一個新模型發佈時,都想說自己有多好,每次都去跟先進的模型做比較,拿測試集或者弄一些榜單,說自己的得分已經跟它差不多了,甚至某些單項上得分已經超過GPT-4,但這並不能證明這些新發的模型與OpenAl這類先進的模型沒有那麼大的差距了。

因爲,模型之間的差距是多維度的,而不是簡單地“跑分”。

一是能力。不管是理解能力、生成能力、邏輯推理能力還是記憶能力等這些基本能力上的差距;

二是成本,大模型想具備某種能力或想精準回答一些問題,需要付出多少成本?有些模型可能推理速度很慢,雖然也達到同樣的效果,但實際上它的體驗還是不如最先進的模型。

在百度文心大模型的實際使用過程中,百度不允許技術人員去打榜。因爲真正衡量文心大模型能力的是,在具體應用場景當中到底有沒有滿足用戶的需求。

有沒有幫助用戶產生價值的增益,這是百度真正在乎的。

2

關於開源模型效率

在商業領域不佔優勢

在此次內部講話中,李彥宏進一步闡釋了外界對開源大模型認知的第二個誤區,即開源模型,並不能解決根本的算力問題。而算力往往需要支持高昂的成本。

“在大模型時代之前,大家習慣了開源意味着免費、意味着成本低。” 他解釋說,比如開源的Linux,因爲已經有了電腦,所以使用Linux是免費的。但這在大模型時代並不成立。

大模型推理是很貴的,開源模型也不會送算力,還得自己買設備,無法實現算力的高效利用。

“效率上開源模型是不行的。” 他表示:“ 閉源模型準確講應該叫商業模型,是無數用戶分攤研發成本、分攤推理用的機器資源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都達到了90%多。”

李彥宏分析,在教學科研等領域,開源模型是有價值的;但在商業領域,當追求的是效率、效果和最低成本時,開源模型是沒有優勢的。

3

關於智能體趨勢

是重要發展方向,

但還不是業界共識

當前,智能體已經受到越來越多的大模型公司及客戶的關注。但關於未來的發展,各家的認知並未達成一致。

在內部講話中,李彥宏談到了大模型應用的發展階段,他認爲首先出現的是Copilot,對人進行輔助;接下來是Agent智能體,有一定的自主性,能自主使用工具、反思、自我進化;這種自動化程度再發展,就會變成AI Worker,能獨立完成各方面的工作。

“雖然有很多人看好智能體這個發展方向,但是到今天爲止,智能體還不是共識,像百度這樣把智能體作爲大模型最重要的戰略、最重要的發展方向的公司並不多。”李彥宏表示。

爲什麼要強調智能體?

李彥宏也給出了答案,“智能體的門檻確實很低”。

很多人不知道怎麼把大模型變成應用,而智能體是一個非常直接、高效、簡單的方式,在模型之上構建智能體相當方便。

據他透露,目前,每週都有上萬個新的智能體在百度文心智能體平臺上被創造出來,智能體在百度生態的日均分發次數已快速增長至800萬次。

“模應一體”,或許正是大模型發展和落地的一個重要方向。

本文源自:子彈財經