☰

大模型該往何處去？百度李彥宏：行業存在三大認知誤區

“外界對大模型有相當多的誤解。”近日，李彥宏一則內部講話曝光再次將大衆的關注點轉向了大模型及AI領域。

據稱，在最近一次和員工交流中，李彥宏首次談到了當下行業對大模型存在的三個認知誤區——大模型競爭、開源模型效率、智能體趨勢。

在他看來，大模型的天花板很高，現在距離理想情況還相差非常遠，所以模型要不斷快速迭代、更新和升級。這個過程可能需要幾年、十幾年如一日地投入，才能真正滿足用戶需求，幫助用戶降本增效。

關於大模型競爭

榜單不代表真正實力

自去年3月以來，大模型相關領域發展得非常迅猛。很多玩家爲了證明自身的產品好，會在發佈之後打榜、猜測試題目、答題技巧等。在外界看來，榜單上的數據似乎表明各個大模型的能力，已經沒有壁壘。

但李彥宏並不認同這一觀點。他表示，每一個新模型發佈時，都想說自己有多好，每次都去跟先進的模型做比較，拿測試集或者弄一些榜單，說自己的得分已經跟它差不多了，甚至某些單項上得分已經超過GPT-4，但這並不能證明這些新發的模型與OpenAl這類先進的模型沒有那麼大的差距了。

因爲，模型之間的差距是多維度的，而不是簡單地“跑分”。

一是能力。不管是理解能力、生成能力、邏輯推理能力還是記憶能力等這些基本能力上的差距；

二是成本，大模型想具備某種能力或想精準回答一些問題，需要付出多少成本？有些模型可能推理速度很慢，雖然也達到同樣的效果，但實際上它的體驗還是不如最先進的模型。

在百度文心大模型的實際使用過程中，百度不允許技術人員去打榜。因爲真正衡量文心大模型能力的是，在具體應用場景當中到底有沒有滿足用戶的需求。

有沒有幫助用戶產生價值的增益，這是百度真正在乎的。

關於開源模型效率

在商業領域不佔優勢

在此次內部講話中，李彥宏進一步闡釋了外界對開源大模型認知的第二個誤區，即開源模型，並不能解決根本的算力問題。而算力往往需要支持高昂的成本。

“在大模型時代之前，大家習慣了開源意味着免費、意味着成本低。” 他解釋說，比如開源的Linux，因爲已經有了電腦，所以使用Linux是免費的。但這在大模型時代並不成立。

大模型推理是很貴的，開源模型也不會送算力，還得自己買設備，無法實現算力的高效利用。

“效率上開源模型是不行的。” 他表示：“ 閉源模型準確講應該叫商業模型，是無數用戶分攤研發成本、分攤推理用的機器資源和GPU，GPU的使用效率是最高的，百度文心大模型3.5、4.0的GPU使用率都達到了90%多。”

李彥宏分析，在教學科研等領域，開源模型是有價值的；但在商業領域，當追求的是效率、效果和最低成本時，開源模型是沒有優勢的。

關於智能體趨勢

是重要發展方向，

但還不是業界共識

當前，智能體已經受到越來越多的大模型公司及客戶的關注。但關於未來的發展，各家的認知並未達成一致。

在內部講話中，李彥宏談到了大模型應用的發展階段，他認爲首先出現的是Copilot，對人進行輔助；接下來是Agent智能體，有一定的自主性，能自主使用工具、反思、自我進化；這種自動化程度再發展，就會變成AI Worker，能獨立完成各方面的工作。

“雖然有很多人看好智能體這個發展方向，但是到今天爲止，智能體還不是共識，像百度這樣把智能體作爲大模型最重要的戰略、最重要的發展方向的公司並不多。”李彥宏表示。

爲什麼要強調智能體？

李彥宏也給出了答案，“智能體的門檻確實很低”。

很多人不知道怎麼把大模型變成應用，而智能體是一個非常直接、高效、簡單的方式，在模型之上構建智能體相當方便。

據他透露，目前，每週都有上萬個新的智能體在百度文心智能體平臺上被創造出來，智能體在百度生態的日均分發次數已快速增長至800萬次。

“模應一體”，或許正是大模型發展和落地的一個重要方向。

本文源自：子彈財經

相關資訊