技術的百度:一場未完待續的冒險
諾貝爾物理學獎花落“AI教父”傑夫·辛頓(Geoffrey Hinton),一度在學術界和產業界掀起“人工智能算不算物理”的大討論。
今天產業界的百花齊放很容易讓人忽視,僅僅十年之前,人工智能這門年輕的學科還在爭議中匍匐前進。辛頓對人工智能的意義在於,他的職業生涯就是這門學科的縮影,爲後來者提供了一個可以量化的歷史座標系。
過去十多年裡,人工智能的發展經歷了三個關鍵節點:
·2012年,辛頓帶着兩個學生參加了ImageNet圖像識別比賽(ILSVRC),以驚人的84%識別準確率奪得冠軍。這個成績深深震撼了學術界和正在投資人工智能的科技公司,神經網絡在人工智能領域的地位從“之一”變成了“唯一”。《深度學習革命》中說:辛頓和他的學生改變了機器看待世界的方式。
傑夫·辛頓(Geoffrey Hinton)
·2017年,在谷歌工作的八位程序員經過數月的合作,創造了一種處理語言的架構,簡稱爲“Transformer”,並在當年7月的一篇名爲“Attention Is All You Need”的論文中描述了該架構。這篇劃時代的論文,拉開了生成式人工智能的大幕。
·2022年底,ChatGPT橫空出世,人工智能過去十年的發展濃縮在一個聊天窗口裡,全世界見證了一個用美元和GPU堆起來的理想主義故事,也極其直觀的感受到了人工智能身上散發着的下一個時代的氣息。
短短十年時間,人工智能經歷了萬馬齊喑後又爆裂般的成長,即便對前沿技術最敏銳的人也有可能漏掉它狂奔途中重要的時刻。全球範圍內,完整參與了三個關鍵節點的科技公司寥寥無幾。
在中國,它是一個意料之外又情理之中的名字:百度。
廣招天下英雄
辛頓早年在多倫多大學任教,曾多次請求學校聘任另一位教授跟自己一起工作,被校方無一例外拒絕,理由是[1]:“一個瘋狂的人做這件事就夠了”。
這代表了2012年之前學術界對深度學習的主流態度——說好聽點是百家爭鳴,說難聽點是死路一條。神經網絡的名稱和結構都取材自人腦的運作方式,由於模擬了人腦的機制,人能做的事情神經網絡都能做,因此,深度學習是一種在理論上非常完美的方案。
然而,無論是它需要吞噬的數據,還是需要消耗的算力,在當時都是一個科幻級別的規模。舉例來說,谷歌的實驗性項目“谷歌貓”用16000個CPU構建了一個10億節點的巨大系統,然而,人腦約有1000億個神經元,神經元之間的節點(突觸)更是多達萬億。
有了這個背景,就不難理解辛頓教授手持兩塊GTX580顯卡橫掃ImageNet大賽,給產業界帶來的震撼了。
但興致勃勃的科技公司馬上遇到了一個嶄新的問題:深度學習是一個非常小的學術圈,頂級學者更是兩隻手數得過來,繼而造就了那場著名的拍賣:微軟、百度、谷歌和DeepMind從1500萬美元喊到了4400萬美元,最終辛頓叫停了拍賣,把自己的“皮包公司”賣給了谷歌。
一場人才爭奪戰就此拉開,谷歌毫不猶豫的買下了陪標的DeepMind。漫不經心的微軟陰差陽錯的在2019年投資了OpenAI,收穫了最大的戰利品。百度親身經歷了美國科技公司對人工智能的義無反顧,在2013年成立了百度深度學習研究院,《智能革命》中說,這是“全球企業界第一家用深度學習來命名的研究院”。
一年後,百度請來了深度學習泰斗級人物吳恩達。後者作爲顧問和“谷歌大腦”的傳奇人物傑夫·迪恩一起帶隊完成了“谷歌貓”項目——讓算法自己觀察和學習貓的特徵,識別圖片裡的貓。
吳恩達在谷歌設計了“谷歌貓”項目
如果沒有ImageNet大賽上大放異彩的AlexNet,改變歷史的很可能是谷歌。吳恩達加入百度的原因也很簡單[3]:當時谷歌對GPU訓練算法態度不明,不支持他購買更多昂貴的GPU,但百度表示“隨便買”。
這場人才爭奪戰對大公司的挑戰性在於,他們要容忍並接受一羣最聰明的頭腦做着流程無法量化、ROI無法計算的工作。這是很多中國公司第一次親身感受“長期主義”的內涵和屬性,也是在移動互聯網百花齊放的年代,百度的一段不太爲人知的歷史。
吳恩達加入百度時,百度在內部發了一封內部信表示歡迎,吳恩達在回信中說:多樣性帶來偉大的創造力,那些從北京到硅谷的好想法將會使我們更快創新,作出更令人驚訝的創新。
兩封看似禮節性的內部信帶來了遠超百度預期的效果,六位人工智能學者通過郵件表達了加入百度的意向——硅谷的科學家可能並不瞭解百度,但都熟悉吳恩達。後來,百度又請來了Dario Amodei,他是日後Anthropic的聯合創始人及首席執行官,Anthropic是OpenAI最主要的競爭對手。
Dario Amodei(左)
ImageNet大賽同年,百度開始大規模採購和建立GPU運算集羣,開發了世界上第一個支持GPU&CPU的並行深度學習平臺PaddlePaddle(飛槳),意在聚攏更多的開發者,做大深度學習的“朋友圈”。
正是由於深度學習長期不被看好,這個領域的研究者是個很小的圈子,然而產業化空間的迅速打開讓科技公司直觀的感受到了人才的重要性。用一個不太恰當的說法,萬物競發的年代,聰明的頭腦是這個產業的“基礎設施”,他們決定了產業界在日後能夠碰觸的上限。
而在許多科技公司真正意識到AI的革命性之前,百度給中國帶來了最寶貴的資產:人才,以及讓他們成長的土壤。
創造產業和生態
今年百度世界大會期間,李彥宏在接受採訪時曾談及百度對人才的看法[3]:好多公司的創始人是百度出去的,有不少互聯網公司的CTO是百度出去的,其實我很高興,這意味着我們既給社會做了貢獻,又樹立了百度的技術品牌。
許多深度學習的先驅人物或多或少都與百度有關,他們有的人留在了百度,有的人離開了百度。人們會習慣性的將人才的去留與公司的成就掛鉤,但這種看法實際上有些片面。
法國公司Mistral是歐洲AI產業炙手可熱的明星。但問題是,這家公司的三個創始人都曾在美國科技公司工作,大部分Mistral員工的上一份工作,也在美國科技公司位於歐洲的分支機構。Mistral成立八個月內的兩次融資中,背後的核心力量也是美國的風投基金和產業資本。
儘管CEO Arthur曾多次公開表示Mistral的主要目標市場是歐洲,並強調歐洲在人工智能領域的獨特優勢。但同樣身不由己的是,Mistral目前一半的客戶都來自美國市場。換句話說,它是個僞裝成法國公司的美國公司。
Mistral的軌跡似乎重複着某種輪迴。憑藉AlphaGo紅極一時的DeepMind誕生在英國,但在創辦第四年就被谷歌收入囊中。Stable Diffusion背後的Stability AI同樣是家英國公司,但似乎所有人都默認它是美國公司。
高等教育可以培養人才,但吸引人才靠的是產業的繁榮。
全世界的高校都有計算機科學專業,但頂尖的人才最終會流向產業的所在地。歐洲和印度貢獻了大量人才,但缺少留住他們的軟件和互聯網產業,這恰恰是中美的優勢。
從2013年成立自動駕駛研發團隊開始,百度投入了對人工智能產業化的探索。一方面,百度以自動駕駛爲錨,在這個最清晰明確的落地場景中不斷開花結果。同一年,百度深度學習研究院開始研發深度學習框架“飛槳”——所謂框架,可以理解爲一個集成了主流算法模型和模型訓練工具的工廠,承接各種模型和行業應用,類似人工智能的操作系統。
2016年穀歌前CEO施密特率隊捧場AlphaGo大戰柯潔,一個重要任務是在中國推廣谷歌的深度學習框架TensorFlow,但反而意識到了飛槳的影響力被自己低估了。同一年,美國《財富》雜誌把百度與谷歌、微軟和Facebook並列稱爲全球四大AI巨頭,認爲其代表了人工智能全球範圍內最頂尖的水平。
百度的自動駕駛探索則在一年後迎來階段性成果,2017年百度Apollo推出了全球首個自動駕駛開放平臺,李彥宏在全程直播的畫面中,坐在一輛自動駕駛汽車前往會場的景象,又給發佈增添了一抹戲劇性色彩。
2017年,李彥宏乘坐無人駕駛汽車進入會場
此後幾年內,百度的無人車相繼落地上海、武漢、重慶等多個城市,曾經遙不可及的Robotaxi也逐漸照進現實,“蘿蔔快跑” 一步步成爲國內服務範圍最廣的Robotaxi。
2016年,飛槳正式開源,爲百度的多元化 AI 業務提供了統一的技術支持。無論是自動駕駛、智能語音等業務,都可以基於飛槳進行開發和優化,也使得百度能夠快速推出新的 AI 產品和服務。2019年3月,百度就發佈了文心大模型1.0版本,持續迭代至今。
2019年的WAVE SUMMIT峰會上,百度CTO王海峰博士曾準確預言了人工智能在未來的走向:“深度學習框架是智能時代的操作系統。深度學習的通用性特點,以及深度學習框架及平臺的發展,正在推動人工智能標準化、自動化和模塊化,進入工業大生產階段。”
時至今日,百度已經形成了最完整的AI產業佈局,包括芯片、智能雲、大模型、自動駕駛等各個領域。全球範圍內,只有谷歌、特斯拉等極少數公司完成了這種佈局。
蘿蔔快跑第六代無人車亮相街頭
這些佈局最大的價值在於,它爲人才提供了一個“蓄水池”,頂尖的人才可以在具體的產業中成長,產業的進步又會聚攏新的人才,他們都留在了中國。這就是生態的含義和意義。
2023年9月7日,《時代》週刊發佈了首屆全球百大人工智能人物。作爲該榜單中唯一入選的中國互聯網企業家,李彥宏和馬斯克、黃仁勳、山姆·奧特曼等企業家共同被評爲全球人工智能領袖。《時代》週刊的評語是:
“李彥宏是中國最傑出的未來主義者,長期投身於人工智能發展的浪潮(As China’s foremost futurist, Robin Li has been riding the AI wave for a long time)。”
從2013年深度學習研究院成立算起,百度在人工智能的投入已經整整十年,但新的故事也纔剛剛開始。
百度的命運
今年的百度世界大會,李彥宏演講主題是“應用來了”,100多個AI原生應用集體亮相。李彥宏指出,過去18個月到20個月的時間裡,大模型領域最顯著的變化,是回答問題的準確性,大模型的幻覺正在消失。
截至11月初,百度文心大模型的日均調用量超過15億次,對比一年前這個數據首次披露時的5000萬次,增長了近30倍。百度智能雲千帆平臺,已經幫助客戶精調3.3萬個大模型,開發了超過77萬個應用。
而伴隨無代碼工具秒噠的推出,一個應用爆發的圖景逐漸展開,如李彥宏所說:百度不是要推出一個“超級應用”,而是要不斷地幫助更多人、更多企業打造出數百萬“超級有用”的應用。
2024年百度世界大會
時至今日,人工智能產業語境下的“人才”早已不再是埋頭堅持的少數學者,但他們的重要性依然舉足輕重。
一個稍微反直覺的事實是,越是繁榮的產業,人才的流動性越大,因爲它代表着這個產業有多少機會和增長。對於一家企業來說,它對人才的吸引力並不體現在有多少人留了下來,而是它被多少人所向往,有多少人因爲它不斷的成長。
李彥宏把自己的人工智能的思考都放在了2017年出版的《智能革命》一書中,他在裡面也談及了百度與人才的關係:百度是中國人工智能產業的代表,大量頂級人才先後投身百度。同時,也有很多人才從百度出發,創造了自己的人工智能應用公司。百度本身就是中國在吸引和培養人工智能人才方面活力的縮影。
七年後接受採訪,李彥宏依然表達着類似的觀點[3]:我覺得更年輕一輩的,現在還沒有出名的那些人,是真正我們最寶貴的財富。
技術理論的突破,人才的聚集,產業界的繁榮勾勒了大部分技術革命的底色,這也是百度在人工智能進步中扮演的角色。今天,百度開始系統性思考,在應用爆發的前夕,自己應該扮演什麼樣的角色。
按照李彥宏的設想,AI智能體將成爲內容、服務和信息的新載體,比網站的想象空間更大。在百度世界大會現場的案例中,比亞迪官方智能體讓銷售線索轉化率提升了119%。
2024年百度世界大會
和促使百度投身深度學習的那場人才爭奪戰一樣,今天人工智能的落地同樣缺少足夠清晰的時間指引和足夠量化的評判指標,對百度來說,它依然是某種長期主義的延伸。
支撐這種宏大願景的不是以季度爲週期的考覈,而是以五年十年爲單位的長遠規劃。風險投資家彼得蒂爾說20世紀初的美國人願意嘗試新事物,敢於規劃幾十年週期的登月計劃並去實現。《馬斯克傳》中說:真刀真槍的實幹家越來越少,動動嘴皮子吹哨的裁判員卻越來越多。這就是爲什麼美國再也造不出高鐵和能夠登月的火箭。
作爲一家公司,百度用十年如一日的技術投入參與了人工智能在中國發展的全過程,在很多個落地場景中,都有百度的身影。
而它扮演的更重要的角色是,在深度學習萬馬齊喑的時期,它給無數人才提供了一個容身之所,爲中國的人工智能產業鋪設了一條發展的道路。
時至今日,百度依然在路上。
尾聲
2021年百度香港上市,李彥宏發佈了一封5000多字的股東信。信中表達的更多是李彥宏作爲一個技術出身的科技公司掌舵者,在人工智能發展路徑逐漸清晰時,對躬身入局的執著和渴望[4]:
我們培養技術人才,我們輸出技術文化,讓更多企業看到技術的價值並重視對技術的投入,搭建起中國互聯網的技術骨架,這是一件意義非凡的事情。
李彥宏還在股東信裡談到了“百度”這個名字——“百度”之前不是一個詞,沒有任何既有的含義,這意味着它的所有寓意都由百度自己來書寫。從2012年開始,百度用一種獨特的冒險精神來定義它。
在無法預知終點的長跑中,可量化的目標沒有意義。很多看似橫空出世的創新,也許都經由反覆的探索,逐漸描摹出來。
人工智能是一篇未完待續的技術史,也是百度的命運。
全文完,感謝您的耐心閱讀。
參考資料
[1] 深度學習革命,凱德·梅茨
[2] 智能革命,李彥宏
[3] 對話李彥宏:應用驅動是百度的第一性原理,基礎模型兩年一個大版本就夠了,甲子光年
[4] 致股東信,李彥宏
作者:李墨天
編輯:戴老闆
視覺設計:疏睿
責任編輯:李墨天