中國超算事業的第一縷“曙光”

在中國科學院計算技術研究所(以下簡稱計算所)“計算的腳步”歷史展廳,“曙光一號”高性能計算機的模型赫然在列。沒有玻璃的阻擋,人們可以駐足觀看它的每一處細節。然而,在“曙光一號”誕生之前,中國進口的高性能計算機(即超算),只能在“玻璃房”中使用。

“曙光一號”的故事,就是從刺激了一代科學家神經的“玻璃房”開始的。

20世紀80年代末,我國在高性能計算機方面遭到美國等西方國家的嚴格禁運,不僅只能以高昂價格購進相對低端的產品,就連正常使用也要在對方監控之下——部署到中國的高性能計算機必須安裝在一間透明機房中,鑰匙由對方掌握,中方人員的一舉一動都在“洋人”眼皮底下,運算的數據也要被他們查得清清楚楚。

“‘玻璃房’是中國的恥辱!”時任國家科委主任、兩院院士宋健的這句話,又何嘗不是每個中國“計算人”心頭的苦澀。

那時,工作站性能以上的計算機市場幾乎被國外公司壟斷,雖有一些自行設計製造的大型計算機,但大多落後幾代或應用極爲有限,被譏爲“‘公機’不會下蛋”。中國民族計算機產業舉步維艱。

▲“曙光一號”計算機(SMP系統)。(圖片來自《中國科學報》)

“新世紀的曙光”

1981年,日本開啓了野心勃勃的“第五代計算機技術開發計劃”。他們希望改進計算機的設計思想,讓計算機具有人工智能的能力。該計劃以10年爲期,投資超過1000億日元,引發全球極大關注,並迅速掀起了一波智能計算機研究的浪潮。

據中國工程院院士汪成爲回憶,在日本“第五代計算機技術開發計劃”影響下,直到1986年,全世界對人工智能技術發展都持相當樂觀的態度,各國紛紛制訂國家級人工智能發展計劃。

是年,我國“863”計劃正式步入歷史舞臺。專家們在討論我國信息技術領域的計劃時,一致同意把智能計算機列爲一個主題項目(即“306”主題)。1990年3月,國家智能計算機研究開發中心(以下簡稱智能中心)依託計算所成立,第二屆智能計算機專家組成員、計算所研究員李國傑被任命爲主任。

“智能中心剛成立就面臨發展戰略的選擇。”李國傑回憶,當時國家的初衷顯然是要研製智能計算機,但是要不要追隨日本研製以並行推理機爲標誌的第五代計算機,他和專家組心裡都有些打鼓。

爲了更廣泛聽取國內外專家的意見,智能中心於1990年5月在北京召開了智能計算機發展戰略國際研討會。與會的學者包括美國總統科學顧問許瓦爾茲、人工神經網絡理論奠基者之一霍普菲爾德、日本第五代計算機負責人之一田中英彥、美國南加州大學教授黃鎧和伊利諾伊大學教授華雲生、中國科學院院士吳文俊等。

“這次會議對智能中心選擇以通用的並行計算機爲主攻方向起到了重要的推動作用。”李國傑說。此後,專家組在反覆研究世情和國情、深入分析國內外專家反映的意見後,一致決定不走日本“五代機”的路,而是堅持“需求牽引、技術推動”原則,擬定了863-306主題的發展計劃綱要,將智能中心的主攻方向確定爲“以並行處理爲基礎的高性能計算機系統”。

採用對稱式多處理器共享存儲並行體系結構(即SMP方案)的“曙光一號”,成爲這個主攻方向的第一個目標。

李國傑還記得,智能中心內部最開始把要研製的計算機命名爲“東方一號”。但在紀念“863”計劃5週年的一次文藝演出活動中,他看到舞臺背景上有“新時代的曙光”字樣,一下子受到觸動。他於是決定,智能中心研製的第一臺計算機叫“曙光”。

“在我們這一代人手裡,中國的高技術應該呈現出燦爛的曙光。”李國傑說。

▲李國傑(左二)和團隊成員一起檢查“曙光一號”主板。(圖片來自《中國科學報》)

“不怕虎的初生牛犢”

其實,SMP方案的確定並不那麼容易,當時“干擾項”很多。

計算所原副所長、中國科學院深圳先進技術研究院原院長樊建平記得,當時國內外傳統大型機發展的慣性思路是,採用中小規模集成電路設計運算控制器主板,而非商品化微處理器。例如,一時風頭無兩的日本“五代機”採用的就不是SMP方案,而是專用機策略。

但專家組最終拍板了SMP方案。一方面,與傳統的小型機、大型機比較,SMP方案在性能價格比方面有明顯優勢;另一方面,基於微處理器的SMP系統的關鍵技術是軟件,技術難點轉移對我國有利。並且,一旦掌握SMP技術,易形成高性能計算機系列產品,有利於科技成果產業化。此外,專家組認爲,國外的並行機技術也在發展中,沒有形成壟斷局面,我們有可能迎頭趕上。

在“306”專家組的共同努力下,“863”計劃的智能計算機研製任務在發展高性能計算機的行動之中落地。用李國傑的話說,那段歲月,我國是以智能計算機的名義發展高性能計算機。

“30多年過去了,現在來看,當時的決策還是正確的。”他說,近幾年人工智能十分紅火,其必要前提就是強大的算力。863-306主題培育的高性能計算能力爲我國在人工智能領域進入世界前列奠定了堅實基礎。

研製“曙光一號”,是智能中心歷史上精彩的一幕。

起初,智能中心並沒有招到多少有計算機設計經驗的人才,李國傑大膽起用國內剛畢業的碩士生、博士生,邊做事邊培養。智能中心成立一年後,就基本形成了以年輕碩士、博士爲主的技術隊伍。他們的平均年齡不到30歲。27歲的樊建平剛剛從中國科學院軟件研究所博士畢業不到一年,就擔任了智能中心繫統軟件組組長;剛剛碩士畢業的孫凝暉只有24歲,就成爲軟件組的主力成員;從計算所碩士畢業的劉金水,從外單位回所參與研發“曙光一號”時也只有28歲。

他們可能無暇顧及,“曙光一號”未來的競爭對手是IBM、惠普這些國際巨頭。在李國傑眼裡,他們是一羣“不怕虎的初生牛犢”。

1991年11月前後,“曙光一號”採用Motorola M88100微處理器、共享存儲多處理機和並行UNIX操作系統的通用開放系統結構總體方案確定下來。

確定了總體方案,接下來的工作就是全力攻堅。但是,當時國內的研發設計環境實在太差:購買硬件器件速度慢,操作系統、部件與工具廠商技術支持弱,高密度生產技術缺乏……巧婦難爲無米之炊,這樣下去不是辦法。

智能中心大膽決策——派一支小分隊到美國硅谷去研發!

▲智能中心走廊“人生能有幾回搏”標語。(圖片來自《中國科學報》)

“洋插隊”的日子

陳鴻安、樊建平、劉金水、李如昆、王永傑等人被選中,前往美國硅谷進行“曙光一號”的封閉式研發。出發前,李國傑爲他們組織了“誓師大會”,臨別贈言只有一句話:“人生能有幾回搏”!

“不做成機器回來,無臉見江東父老。”小分隊成員也撂下“狠話”。

1992年3月,樊建平等人開始了爲期11個月左右的“洋插隊”生活。

小分隊在美國工作與生活的地方,樊建平記憶猶新。那是一處美式民居,有4間臥室,廚房與客廳很大。爲方便加班,大家決定將辦公地點設在客廳。除了外出與部件廠商進行技術交流等活動外,他們大部分時間都生活與工作在這個民居里。

“當時被派到美國去的那些人,可不是去過好日子的,他們的條件非常艱苦。”李國傑回憶,“幾個人擠在一處民居里,客廳就是工作間,所有房間都沒有牀,大家都是鋪一張牀墊睡在地上。他們每天工作十五六個小時以上,沒日沒夜,衣服都不怎麼脫。所以,他們才戲稱自己是‘洋插隊’。”

生活上,大家以星期爲單位,輪班做飯。晚飯後的散步或騎自行車是他們主要的娛樂與體育鍛煉活動。後來,他們買了一輛二手汽車,自學開車考駕照成爲另一種“娛樂”活動。

他們的每一天被分成上午、下午、晚上3個工作單元,沒有周末、沒有節假日,除了睡覺、吃飯、散步,其他睜眼的時間都在工作。近一年的時間裡,他們安之若素,沒有人心猿意馬、三心二意。

他們深知,自己肩上扛着的是“曙光一號”的前途命運,是中國計算機事業的使命。

在硅谷期間的研發工作,分爲總體方案完善、設計、生產加工及部分調試幾個階段。樊建平記得,完善總體方案的那一個多月裡,他們與國內交流最爲密切,通過傳真與國內團隊圍繞多處理機中斷控制器的設計與實現不斷進行研討。當時,智能中心軟件組與硬件組部分人員繼續配合“曙光一號”硬件及並行程序的設計,同時抽調部分人員組成“曙光1000”組,開啓“曙光1000”的早期預研。

由於利用了硅谷的產業環境,“曙光一號”的研發進程大大加快。不到半年,“曙光一號”的硬件設計接近完成。至1992年10月,小分隊完成了主板設計並進入印製電路板(PCB)的設計和生產階段。11月左右,用作中斷控制器的FPGA芯片(一種稱爲可編程邏輯陣列的半定製集成電路)研製成功,這是全對稱多處理機的關鍵芯片。這之後,軟件設計調試與硬件並行展開。同時,智能中心軟件組對引進的UNIX源程序已進行近兩年的逐行分析解讀,在參考Encore並行計算機基礎上,樊建平等人成功研發中國第一個並行UNIX操作系統,取名爲SNIX(Symmetric UNIX),率先在國內實現線程級細粒度並行。

國內的研發團隊也在搏命飛奔,在當時十分簡陋的科研環境裡,常常工作到很晚。

1993年2月,硅谷小分隊帶着已進行初步調試的幾塊“曙光一號”主板載譽歸來,並迅速與國內的同事開啓聯調及軟件移植工作。

“曙光一號”團隊不負衆望,僅用了兩個月,計算機硬件、顯示設備、基本輸入輸出系統及操作系統核心的調試工作就基本完成。由張兆慶和喬如良領導的並行編譯、劉曉華負責的Express編程環境、孫凝暉等負責的計算性能測試與優化、隋雪青等負責的數據庫移植與事務處理測試等工作,也在後來的兩三個月內逐一完成。

“曙光一號”成了!

1993年10月,科技部組織國內專家學者對“曙光一號”進行成果技術鑑定,專家們給予了高度評價。時任中國科學院副院長鬍啓恆稱:“‘曙光一號’咬住了國際高性能計算機發展的‘尾巴’。”

▲“曙光一號”赴美國研製團隊(左起依次爲李如昆、樊建平、陳鴻安、賈沛長、劉金水、王永傑)。(圖片來自《中國科學報》)

“這一腳踩下去是轟隆隆響的”

胡啓恆一直十分關注“曙光一號”的進展。她在一次接受採訪時回憶起那段經歷,非常感慨地說:“‘曙光一號’這一腳踩下去是轟隆隆響的。”

“曙光一號”誕生後不久,由美、英、日等發達國家組成的“巴黎統籌委員會”組織宣佈解除10億次高性能計算機對中國的禁運。“863”計劃的主要發起人、兩院院士王大珩在考察智能中心後給中央領導寫的報告中指出:“‘曙光一號’研製成功的意義不亞於衛星上天。”

1994年,“曙光一號”作爲國內科學技術的兩項標誌性成就之一,被寫入1994年的政府工作報告。

相比此前研發的計算機型號,“曙光一號”的研發僅歷時一年多,研究團隊成員也只有年輕的碩士、博士,投入經費只有區區200萬元。其研製經費之少、研製時間之短、成果商品化程度之高等都與過去形成鮮明對比。可以說,智能中心的一批“小將”以自己的頑強拼搏,爲打破高性能計算機領域的國外技術封鎖作出了歷史性貢獻。

“‘曙光一號’帶來的科研經驗是寶貴的。”李國傑說,正確選擇科研方向是成功的首要條件。更可貴的是,此後科研團隊並沒有專注於發論文,而是擔起了更重要的使命——實現產業化。

1994年1月,時任國家科委主任宋健來到智能中心視察,看到“曙光一號”團隊的成果“曙光初現”,號召智能中心勇當“敢死隊”,“像當年劉鄧大軍一樣殺出重圍”。智能中心積極響應這一號召,依託“曙光一號”的科研成果,於1995年成立了曙光信息產業有限公司,即今天的中科曙光。

“曙光機一開始就沒有以發表SCI文章爲目標,因爲我們想的是要在市場上佔有一席之地,這個目標非常明確。”李國傑說,“曙光一號”自研製之初,就把產業化、市場化作爲目標。

“‘曙光一號’在設計階段的一個理想就是成爲產品,而不僅僅是科研成果,鑑定會就是它的市場推廣會。”樊建平告知,當時,“曙光一號”系列機型已在教育行業、信息服務、行政管理及援外項目等領域實現了成功應用。

“‘曙光一號’的成功研製,開闢了一條在開放和市場競爭條件下發展高技術的新路。”李國傑總結,當年智能中心對“洋插隊”提出了“兩做、兩不做原則”——完全屬於仿製、沒有自主知識產權的產品不做;只爲填補空白、市場上沒有競爭力的產品不做。那做什麼呢?集中力量,做國外對我國封鎖的技術和產品;努力趕超,做國外尚不成熟的技術和產品。

“現在看來,這些原則還應當堅持。”李國傑說。

以“曙光一號”爲起點,中國超算事業拉開了自力更生、自立自強的大幕。此後的30年,在曙光、天河、神威等系統一代代研製者的努力下,國產通用高性能計算機幾乎佔領了全部國內市場,成爲中國打破“禁運”、發展自主可控高技術產業的榜樣。

“曙光一號”的意義還在於,它闖出了一條市場導向的高技術研究開發的理念和技術路線。經過20多年發展,以“曙光一號”知識產權爲基礎成立的中科曙光已成爲我國高性能計算的骨幹企業,並於2014年在上海證券交易所主板上市。後來中科曙光又控股創辦了我國中央處理器(CPU)設計領域的骨幹企業海光公司,控股參股孵化出中科星圖和曙光數創等上市公司。曙光繫上市公司以其近3000億元的市值,成爲“863”計劃科研成果轉化中最具代表性的案例之一。(完)

記者/趙廣立

來源:中國科學報