黃鐵軍:做全球頂尖的AI研發機構丨AI·20人

經濟觀察報記者 任曉寧 北京報道

OpenAI創始人山姆·奧特曼出現在大屏幕上,當他回答“我準備好了”時,全場都沸騰了。

這是6月10日 “AI春晚”北京智源大會上的一幕,那是山姆·奧特曼首次亮相中國。那個夏天,所有人都在爲AI即將改變世界而興奮。

在那一天,一衆全球知名的AI科學家,比如圖靈獎得主、Meta首席AI科學家楊立昆、深度學習之父傑弗裡·辛頓等,全部出現在大會上。楊立昆因爲總統會見不能來京,堅持半夜4點起牀,只爲和中國觀衆實時交流。

北京智源人工智能研究院(以下簡稱“智源研究院”)院長黃鐵軍當時坐在臺下,這些大咖很多由他邀請而來。在大衆層面,知道黃鐵軍和他身後的智源研究院的人並不多,但在全球AI圈,他是一個響噹噹的人物;這個成立於2018年的研究院,早已在AI圈聲名遠播。

黃鐵軍研究AI超過30年,擅長智能視覺信息處理技術,對我國數字視頻編碼國家標準制定和大規模產業化做出過突出貢獻,終結了國外向我國視頻行業索取高額專利費的歷史。他與國外AI大咖們私交甚篤,楊立昆的個人自傳《科學之路》中文版,也邀請黃鐵軍寫了序言。

近30年時間裡,黃鐵軍的身份是科學家、北大教授,現在,智源研究院是他花費精力最多的地方。今年4月,微軟總裁布拉德·史密斯接受外媒採訪時說,他認爲有全球三家機構處於AI絕對的前沿,一是與微軟合作的Open AI,二是谷歌,另一個就是北京智源人工智能研究院。

今年大火的大模型,智源研究院早在2019年開始佈局。2020年,在大多數人對大模型還一無所知的時候,黃鐵軍掌舵的智源,將主要精力和資金放在研發大模型上,並在2021年上半年推出了開創“中國首個”、“世界最大”的大模型悟道1.0和悟道2.0。

“很多說中國大模型熱,是因爲ChatGPT火了之後才爆發的,其實並非如此。早在ChatGPT出現之前一年半,我們就已經開始系統化佈局。那邊爆發的時候,這邊的艦隊已經起航。”8月28日,黃鐵軍對經濟觀察報記者說。

目前,智源已經培養了一批大模型人才,當前大模型創業公司、大廠,從事研發的CTO或首席科學家中,甚至是創始人本人,參加過悟道項目的人爲數不少,智源也因此被人稱爲大模型“黃埔軍校”。對於人才被挖角,黃鐵軍並不排斥,“肉都在一個鍋裡”,“只要他們還在這個行業,還在爲大模型發揮作用,都是可以的”。他覺得,智源作爲非營利機構,能爲行業培養人才,就是促進AI生態發展的有意義的事。

闖過無人區

智源人工智能研究院在2020年選擇做大模型時,國內鮮有機構或公司從事這項研究,這彷彿就是一個無人區,智源一腳踏入,並不是偶然。

8月29日,北京五道口智源大廈5層,黃鐵軍向記者講述了這段往事。

故事的開始其實比2020年還要更早一些,2018年11月,智源人工智能研究院成立,由科技部和北京市共同支持,聯合北京人工智能領域優勢單位共建。黃鐵軍擔任首任院長。

他本人非常樂意做這件事。當時他的職務是北京大學計算機科學技術系主任,從2015年開始全程參與我國新一代人工智能發展規劃建議、起草和實施。他願意來智源的原因是,這裡與企業、學校都不一樣,是一種世界範圍內都很新的新型研究機構,在這裡,可以更高效的探索AI。

擔任院長頭兩年,黃鐵軍在智源的工作重心是凝練方向,“智源學者計劃”匯聚了中國頂尖人工智能學者,開啓了“自由探索+目標導向”科研機制探索。2020年,智源研究院決定把大模型作爲攻堅目標,70%的預算投入到大模型研發和大模型基礎軟硬件生態建設。當年3月,黃鐵軍在悟道1.0發佈會上提出,“人工智能正在從‘大煉模型’到‘煉大模型’的新階段”,這是“大模型”這個概念首次登上歷史舞臺。

黃鐵軍告訴記者,做研究久了,會有一種直覺式的預感。而且,大模型這個方向,雖然外界很少有認知,但在AI科研圈已經有一個比較清晰的趨勢判斷,即:大模型將成爲AI未來平臺的起點。

從有想法到最終落實,並不容易。2020年10月,黃鐵軍在一次會議上與時任北京市市長陳吉寧彙報中提到,智源計劃集中資源開展大模型研究。陳市長當機立斷,明確提出大模型會是人工智能的下一個核爆點。

智源投入幾乎全部科研力量。研發進展很快,第二年,2021年3月,“悟道1.0”大模型項目問世,2021年6月,間隔3個月後,“悟道2.0”亮相。當時的“悟道2.0”,創造了“世界最大”紀錄,達到1.75萬億參數;是GPT-3採用的1750億參數量的10倍,也超過了谷歌發佈的Switch Transformer(1.6萬億參數量)。

“悟道2.0”面世後,繼續突破需要更多的算力和資源。然而,當時正值AI低谷期,前一代AI四小龍備受質疑,新一代AI公司融資無門,即使智源,也資源受限。

2023年8月,記者問他,如果當時繼續做“悟道3.0”“悟道4.0”,會不會推出ChatGPT的就是智源,而不是OpenAI?會不會覺得可惜。

他也覺得有點兒可惜,不過他想的很透徹:即使繼續做,後來能引發全球爆火的,依舊會是OpenAI,因爲雙方投入的資源完全不是一個量級,而大模型這個方向,缺乏算力資源,無異於紙上談兵。

“2022年下半年,我們的算力資源在國內已經是領先的了,但不足OpenAI的十分之一。如果只差一兩倍,我們還有可能領先,如果差10倍以上還想領先,可能性就很小了。”

AI黃埔軍校

今年2月,王慧文成立光年之外,廣發英雄帖,之後大模型公司風起雲涌。現在回顧會發現,大模型創業公司的技術帶頭人,很多來自智源。

智譜AI創始人唐傑曾擔任過智源人工智能研究院副院長,目前智譜AI被美團投資,與360合作;即將完成10億元融資的月之暗面創始人楊植麟,也參與過悟道的研發。除了創業公司,字節跳動等互聯網大廠的大模型帶隊者,也或多或少參與過智源項目。

一些國家項目的技術骨幹,也同樣來自智源。有些智源學者參與國家項目做研發,也會把算法結果放到智源的開源論壇中,供所有研究者共同探討,黃鐵軍告訴記者,他對此覺得很欣慰。

擔任智源研究院院長前,黃鐵軍當了十幾年北大老師,習慣了教書育人。現在,他依舊把發掘人才作爲基本工作。

黃鐵軍本人其實是一個“天馬行空”的科學家,記者問他,從業AI這麼多年,有沒有最得意的二三事?他並沒有把十多年前確立的標準和專利積累當做值得講述的事,反而覺得,2015年的一天,他突然靈光一現,豁然開朗,推翻了圖像視頻概念,推翻了計算機視覺的基本範式,當然也推翻了自己此前20多年的研究,開創了脈衝視覺原理和技術新體系,一切從零再出發,是更有意思的事。

“我個人的看法是,重大創新一定是首先在一個人腦子裡出現,否則它就不會發生。”他和年輕學者們交流,也更熱衷於談論天馬行動的想象,即使當下不可能發生,但未來,有可能突然有一天就能實現了。擔任院長後事務繁瑣,黃鐵軍不再有精力一行一行敲代碼,和年輕學者一起腦暴,培養、發掘年輕人,是他最開心的事情之一。

從成功率上講,未知的想象有很大風險,但是一旦成功,影響會是巨大的。

2018年,智源成立之初,就定下目標:支持科學家勇闖AI科技前沿“無人區”。他們給智源學者提供經費,希望支持學者們自由探索,挖掘面向未來的AI研究方向。

2023年,智源曾經耗費絕大部分資源和精力投入的大模型方向,已經從“無人”變得熱鬧非凡,但也意味着更多未解之謎,有更多需要探索的新無人區。黃鐵軍說,智源要與企業錯位發展,開展更冒險、更開放、更前瞻、更創新地的工作,這是智源作爲研究機構應該做的事。

5年時間,智源已經嶄露頭角,現在,黃鐵軍提到,更重要是實現當年立下的十年目標:2028年智源研究院成爲全世界公認的頂尖人工智能研發機構。

他還在繼續證明自己。

黃鐵軍(受訪者供圖)

【對話】

艦隊啓航

我們既不以論文爲最終的評價指標,也不以產品作爲評價指標;我們想做的,是一個創新性強、性能領先的系統,建立一套技術體系,一個技術生態。

經濟觀察報:如何定位智源?

黃鐵軍:智源的性質是介於大學和企業之間的一種新型研發機構。我們既不以論文爲最終的評價指標,也不以產品作爲評價指標,而是要做有創新性的系統。這種機構在國外也是很新的形態。從我個人來說,我2015年就開始參與我國新一代人工智能發展規劃,這種科技創新組織方式的改革,是這幾年國家很關注的一個方向,我願意到智源來做這樣的嘗試。

原有體制下開展AI研究,大學受制於資源有限,企業受制於產品收入壓力,都約束了創新突破的可能性。智源這種機構有探索出新可能性的很大機會,這是吸引我的最重要的原因。

經濟觀察報:智源是國內第一個提出大模型概念的機構,也早在2020年就投入大部分資源做大模型。爲什麼是智源?

黃鐵軍:其實早在2018年、智源研究院成立時,我們從科研的角度對於AI已經看到一個比較清晰的趨勢,大模型已經是一個比較明確的方向了。當時大模型還不叫大模型,我們看到的方向是:用大數據訓練一個規模很大的模型,有望產生更強的智能。

2020年10月份,我們和時任北京市市長陳吉寧彙報中提到,智源計劃集中資源開展大模型研究。陳市長當機立斷,明確提出大模型會是人工智能的下一個核爆點。我們就開始買算力做事,當時買到了300P的算力,但是300P肯定是遠遠不夠的,就申請再追加單獨的經費來做更大的算力。最後定下的是1000P的算力,大約是3億元人民幣的一個專項支出。這種規模的智算平臺在當時中國是絕對領先的。

經濟觀察報:智源2021年6月就推出了兩個大模型產品,直到2023年6月,才又推出了悟道3.0。中間爲何間隔這麼久?

黃鐵軍:悟道2.0推出後,我們中間發生了一個重大的變化。當時從我們科研角度來看,新的AI時代已經開始了,雖然那時候沒有多少人相信,但在我們這些人眼中,門已經打開了。

我們於是開始考慮,既然它是一個時代的事,就絕對不會是智源一家機構在做,它應該是一個全社會、全世界的事情。

當時我們的分歧點是,繼續做一個悟道3.0版,把它做得更大更強?還是在全國範圍內進行佈局,讓不僅是北京中關村地區,而是全中國範圍都可以做這件事?最終我們選擇了後者,在國家新一代人工智能重大科技項目中提出了一個旗艦項目建議,從國家的科技佈局角度,做系統化的佈局和支持。

國家項目立項是需要時間的。從2021年6月份提出建議,到2022年12月份項目批准,花了一年半時間,在傳統項目體制下已經是特別快了。這個旗艦項目2023年1月開始執行,計劃通過滾動方式,一直持續到2030年,目標不是把一個模型做多大,或者性能做多高,而是要通過數據共建、算法競爭、開放評測、開源協同的創新機制,建立一套大模型開源開放技術體系,一個支撐大模型持續發展的技術生態。

所以,很多時候大家說中國大模型熱是因爲ChatGPT火了之後才爆發的,並非如此,早在ChatGPT出現之前一年半,我國就已經開始系統佈局,那邊爆發的時候,這邊艦隊已經起航。

AI新時代

新技術變革如果發生在中國,大家當然會更高興,沒首先爆發在中國,也不意味着我們就失去了機會。

經濟觀察報:會不會覺得遺憾?比如說,如果去年6月你們就發了悟道3.0,說不定年底的時候火的就不是ChatGPT,而是你們?

黃鐵軍:即使我當時發佈了,也不一定會火。這與大模型的屬性是有密切關係的。

大模型的數據量與投入直接相關,我們的算力、數據投入都與OpenAI差的很遠。而且差的不是一點半點,我們是1000P的算力,不到2000塊卡,ChatGPT大概是3萬塊卡,它是你15倍的算力,迭代速度會快很多。

科技體制改革的不容易就體現在這裡,我們能調動的資源是幾億元人民幣的體量,OpenAI是用10億美元、100億美元力量在做。如果只差一兩倍,我們就有可能領先,如果差10倍以上你還想領先,這種事可能性就很小了。

但是反過來說,我們也不必糾結一城一池的得失。新技術變革如果發生在中國,大家當然會更高興,沒首先爆發在中國,也不意味着我們就失去了機會。

所以一方面確實是有點兒可惜,但另一方面,我們也不會被打亂節奏,我們從2021年想做的就是建立一個體系,希望在技術體系上保持在前沿的位置,做一個讓大家一起參與的旗艦項目,讓所有人都能發揮自己的聰明才智,共同塑造AI新時代。

經濟觀察報:現在悟道已經推出3.0了,也已經開源了,接下來你們還想做什麼?還有哪些可做的事情嗎?

黃鐵軍:我們作爲一個科研機構,和企業和高校所做的事不一樣,我們會做更前瞻的一些探索。僅就大模型來說,現在是剛剛揭開大幕,可做的東西非常多。

打個比方,大模型在當下,就相當於法拉第轉動電磁線圈,能夠產生電流了。發電機剛面世,能產生電流,大家很興奮,但是如何讓電流在全社會流通和應用,還有大量的創新性探索要做。

比如在大模型領域,有沒有一種技術手段,能讓現在訓練的成本降低一個數量級?這種風險很大的創新,是我們應該做的。還有在理論領域,爲什麼大模型能這麼強?尋找這種理論上的解釋,也是我們應該做的。另外會不會有一些架構上的創新,能把一些新技術要素結合在一起,訓練出更高水平的智能?甚至再往大了說,會不會有顛覆大模型的創新出現?這些探索我們也應該嘗試。我們要比企業更冒險、更開放、更前瞻、更創新地做一些工作。

挑戰與想象

在20年之後,AGI有很大可能實現。那時信息表達和流轉的方式,神經元和神經網絡結構及信號加工機理,都會有巨大變革,這些變革預計會在2045年之前會出現

經濟觀察報:您曾在2015年時預判2045年會有AI超級大腦出現,經過幾年探索後,您的想法變化了嗎?這個時間點會提前或延後嗎?

黃鐵軍:現在的想法會比2015年更樂觀一些,因爲經過近10年的進展,發現AI比原來預想的進展更快了。

現在有些人認爲,再過2至5年就能實現AGI(通用人工智能),我覺得可能還得再等20年。因爲真正的實現AGI,和只在某些方面實現AGI,是有本質區別的。

真正的AGI一定是有自主意識的,人類擁有的智能它全部具備,而且它一定會從多個維度全面超越人類,說的通俗點就是超人,比你在科幻電影裡看到的那種超人還要超人。它不一定以實體方式出現,可能不一定是我們目前能想象到的形態,但它肯定會有物理載體。

經濟觀察報:這些挑戰具體是什麼?我們能解決嗎?

黃鐵軍:做了30多年AI,我一直說AI首先是一門技術,我們要尋找一種可行的技術途徑和方法,再通過工程方法把智能做出來,這裡面有很多不確定因素。

在技術這條路上,突破偶爾會發生,絕大多數時間是在黑暗中探索,這是常態。像我自己,一二十年反反覆覆這種狀態,沒有大突破,這是很正常的,一點都不奇怪。

但沒有重大進展並不意味着人不聰明、不努力,只是因爲重大突破沒有標準答案,沒有一個規律性的路徑讓你照着做。

然而,正是因爲“面壁十年”,破壁而出、豁然開朗才彌足珍貴,一次突破,足慰平生。2015年我發明脈衝攝影原理時就是這樣的感覺。這個原理顛覆了1839年發明的曝光成像原理,把普通光電傳感器“點石成金”,賦予AI一雙追光逐電的慧眼。

AlphaGo表明AI決策能力可以超越人類,大模型正在塑造的則是AGI無所不知的認知大腦。未來10年到20年,這樣的創新還會紛沓至來,信息表達和流轉的方式,神經元和神經網絡結構及信號加工機理,將會發生巨大變革,未來的AI將採用類似生物大腦的脈衝神經網絡系。我現在仍然認爲,2045年左右,將出現真正的AGI。

在此之前,人類社會將享受20年的科技革命紅利,同時也將積累從未面對的巨大風險。現在就應該投入充足資源開展風險研究,並開發相應的技術支持工具。

版權聲明:以上內容爲《經濟觀察報》社原創作品,版權歸《經濟觀察報》社所有。未經《經濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行爲主體的法律責任。版權合作請致電:【010-60910566-1260】。

任曉寧經濟觀察報記者

TMT新聞部資深記者關注並報道TMT(科技、傳媒、通信)領域重大事件,擅長行業分析、深度報道。聯繫郵箱:renxiaoning@eeo.com.cn微信號:tangtangxiaomo