一文看懂百度AI開發者大會:三大AI神器、文心4.0工具版生產力拉滿
過去一年,李彥宏與創業者、開發者交流,感受到了“FOMO”狀態的盛行,即“Fearof Missing Out”,既興奮又擔心錯過。不過百度一直緊追大模型風潮,大模型和生成式AI也正在徹底改變開發者羣體。
在今天的百度AI開發者大會上,李彥宏直言,過去,開發者用代碼改變世界;未來,自然語言將成爲新的通用編程語言,使每個人都有可能成爲開發者,用創造力改變世界。這一天即將到來,因爲強大的基礎大模型和低門檻的開發工具,開發者的生產力得到了顯著提高。
談及百度的角色定位,作爲技術公司,百度希望爲大家提供所需的開發工具,不斷提升整個社會的創造力。具體而言,百度提供了一系列強大的基礎模型,如文心大模型系列,以及基於大模型開發各種應用的工具,如智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder和各種尺寸的模型定製工具ModelBuilder。在今天的AI開發者大會上,李彥宏爲大家一一演示了這三款“AI神器”,並對文心一言過去一年的成績進行回顧。
談文心大模型進展:4.0工具版支持代碼解釋器
文心一言發佈一年來,用戶數突破2億,API日均調用量超過2億,服務客戶數達8.5萬,利用千帆平臺開發的AI原生應用數超過19萬。文心一言正在改變更多人的工作和生活,支撐文心一言的基座模型是文心大模型,經歷了從3.0版本到4.0版本的進化,在理解、生成、邏輯、記憶四大能力方面達到了業界領先水平。
文心大模型4.0的工具版今日發佈,支持代碼解釋器功能,通過自然語言交互實現對複雜數據和文件的處理與分析,能夠生成圖表或文件,洞察數據中的特點、分析變化趨勢,爲決策提供支持。
同時,相比一年前的文心大模型,其目前算法訓練效率提升到了原來的5.1倍,推理性能上提升了105倍,推理的成本降到了原來的1%,也就是說客戶過去一天調用1萬次,今天在同樣的成本之下一天可以調用100萬次,這樣對於企業和開發者十分有利,因爲其最關注的就是成本和效果。
如果做到降本增效?這是因爲百度在芯片框架模型和應用這4層架構有着全棧的佈局,通過端到端的優化,不斷的把成本打下來,讓更多的人可以高效低價大模型來做AI應用。
李彥宏也強調,語言模型本身並不直接創造價值,基於大模型開發出來的AI應用,纔是能夠真正滿足市場需求的東西。
談AI原生應用:三大AI神器滿足不同應用需求
百度高喊了一年的“要做AI原生應用”,目前成果如何呢?李彥宏也現場分享了基於大模型開發AI原生應用的具體思路和工具。主要包括MoE架構、小模型、智能體。百度提供了三大AI神器,包括AgentBuilder、AppBuilder和ModelBuilder,以滿足不同應用需求。
1、Agentbuilder:5分鐘開發一個智能體
智能體是未來大型AI應用的主流使用方式,基於強大的基礎模型,智能體可批量生成,應用於各種場景。百度升級了文心智能體平臺,已有3萬多個智能體被創建,5萬多名開發者入駐。爲實現讓每個人、每個組織都成爲智能體的開發者的目標,百度提供了零門檻的智能體開發工具AgentBuilder。
舉例來說,用戶可藉助百度平臺創建名爲“新加坡旅遊局”的智能體,通過自然語言交互設置其提供旅遊文案、解答問題、提供酒店門票等服務。這一創新性智能體開發方式爲用戶節省了大量時間和精力。
2、AppBuilder:自然語言三步就能開發一個應用
AppBuilder是當前最好用的AI原生應用開發工具之一,其優勢在於提前封裝和預置了各種組件和框架,大幅降低了開發門檻。開發者只需三步,即可用自然語言開發出一個AI原生應用,並輕鬆發佈、集成到各種業務環境中。
在一次AI原生應用開發挑戰賽中,有選手利用AppBuilder開發了一款“遊樂場排隊規劃助手”,幫助遊客更好地瞭解遊樂場排隊情況,並設計個性化的遊玩路線。令人驚訝的是,冠軍選手沒有寫一行代碼,卻憑藉基礎模型和AppBuilder工具贏得了10萬元大獎。
以“遊樂場排隊助手”爲例,開發過程只需三步:首先在AppBuilder的開發界面中給應用命名;其次,在角色指令中描述具體需求,包括調用代碼解釋器、計算最佳組合等;最後,在工具組件中添加代碼解釋器,幫助進行運算。
AppBuilder已經升級,引入了“AI優化配置”功能,能夠自動優化角色指令、組件配置等環節,進一步提高開發效率。
AppBuilder還提供了跨模態能力,支持用戶快速創建繪畫類應用,如漫畫、兒童畫本等。用戶只需輸入文本描述,即可生成相應的圖畫。
總的來說,AppBuilder的兩大優勢在於功能強大和簡單易用。其豐富的組件工具和自然語言開發流程使得AI應用開發變得更加高效和便捷。
3、ModelBuilder:高效低價生產模型
ModelBuilder是一款適合專業開發者使用的工具,它能夠根據開發者的需求定製任意尺寸的模型,並通過對模型進行精細調整,使其在特定場景下達到更好的效果。這種定製化的模型開發對於提高模型的適用性和性能至關重要。
以教育行業的作文批改爲例,模型定製工具ModelBuilder通過三個步驟實現了模型精調:首先是創建數據集,包括數據清洗、數據標註和數據增強;其次是選擇基礎模型並配置參數進行精調;最後是將模型部署在平臺上。通過這些步驟,ModelBuilder能夠生成適用於特定場景的高質量模型。
通過使用MoE(混合專家模型)模型路由,可以將不同大小和性能的模型組合起來,以達到最佳的性價比。以小度爲例,它根據用戶的不同問題調用不同大小的模型,從而在保證效果的同時降低了成本和響應時間。通過這種方式,可以實現模型的靈活調度和資源的最優利用。
ModelBuilder預置了最全面最豐富的大模型,包括旗艦版的大模型(如ERNIE3.5和ERNIE4.0)以及輕量級的大模型(如ERNIESpeed、Lite、Tiny)。此外,還支持國內外第三方主流模型,總數達到77個,爲開發者提供了豐富的選擇。通過定製化模型開發,可以有效提高模型的性能和適用性,同時降低成本和開發門檻。
談大模型商業模式:開源模型會越來越落後
“因爲有了最強大的基礎模型文心4.0,我們可以根據需要,兼顧效果、響應速度,推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,並且支持精調和postpretrain。”
李彥宏提到,這樣通過降維裁剪出來的模型,比直接拿開源模型調出來的模型,同等尺寸下效果明顯更好,同等效果下,成本明顯更低。
李彥宏還指出,大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落後。
在李彥宏看來,多模態大模型是通往AGI的必經之路,視覺大模型最大的應用場景是自動駕駛。
“面向未來,我認爲多模態大模型,或者說文字、圖片、語音、視頻等多模態的融合,是基礎模型非常重要的長期發展方向,是通往AGI的必經之路。百度在這些領域有着長期投入,並將及時更新大模型的最新進展。”
李彥宏提出了非常不一樣的判斷:視覺大模型最大的應用場景是自動駕駛。百度不只訓練AI如何生成視頻,更訓練AI理解真實世界發生的事情並預測未來。
在開發者大會最後,李彥宏有感而發:
“今天的中國,有10億互聯網用戶,有強大的基礎大模型,有足夠多的AI應用場景,有全球最完備的產業體系,國家也在大力鼓勵和支持‘人工智能+’行動,每一個人,每一家企業,只需要充分利用這些工具,就可以釋放無限的創造力和生產力。”
“人人都可以成爲開發者,而未來,也必將是一個由開發者一起創造出來的未來!”李彥宏總結稱。