受《周易》啓發!北京清華團隊發佈陸AI光晶片「太極」
北京清華團隊發佈陸AI光晶片「太極」受《周易》啓發。圖爲光電智慧技術交叉創新團隊部分成員合影(左三爲戴瓊海院士、右二爲方璐副教授)。 (微信公衆號清華大學)
北京清華團隊發佈陸AI光晶片「太極」受《周易》啓發。圖爲成果發表在最新一期的《科學》(Science)上。(微信公衆號清華大學)
據微信公衆號「清華大學」12日消息,北京清華大學電子工程系方璐副教授課題組、自動化系戴瓊海院士課題組摒棄傳統電子深度計算範式,另闢蹊徑首創分散式廣度智慧光計算架構,研製全球首款大規模干涉衍射異構集成晶片太極(Taichi),實現160 TOPS/W的通用智慧計算。該研究成果於12日凌晨以〈大規模光晶片「太極」賦能160 TOPS/W通用人工智慧〉爲題發表在最新一期的《科學》(Science)上。
方璐、戴瓊海爲論文的通訊作者,電子工程系博士生徐智昊、博士後周天貺(清華大學水木學者)爲論文第一作者。
隨着各類大模型和深度神經網路涌現,製造出滿足人工智慧發展、兼具大算力和高能效的下一代AI晶片已成爲國際前沿熱點。
作爲人工智慧的三駕馬車之一,算力,是訓練AI模型、推理任務的關鍵。光計算,是將計算載體從電變爲光,利用光在晶片中的傳播進行計算,以其超高的並行度和速度,被認爲是未來顛覆性計算架構的最有力競爭方案之一。光晶片,具備高速高平行計算優勢,被寄予希望用來支撐大模型等先進人工智慧應用。
智慧光計算作爲新興計算模態,在後摩爾時代展現出有望超越矽基電子計算的潛力。然而其計算任務侷限於簡單的字符分類、基本的影像處理等。其痛點是光的計算優勢被困在了不適合的電架構中,計算規模受限,無法支撐亟需高算力與高能效的複雜大模型智慧計算。
協助光計算「掙脫」算力瓶頸,另闢蹊徑,「從0到1」重新設計適合光計算的新架構,是清華團隊邁出的關鍵一步。
方璐將這次科研歷程比擬爲浪漫的「雙向奔赴」:從演算法架構上自頂向下探索,在硬體晶片設計上自底向上推演。
相異於電子神經網路依賴網路深度以實現複雜的計算與功能,「太極」光晶片架構源自光計算獨特的「全連接」與「高並行」屬性,化深度計算爲分散式廣度計算,爲實現規模易擴展、計算高並行、系統強魯棒的通用智慧光計算探索了新路徑。
論文第一作者、電子系博士生徐智昊指出,在「太極」架構中,自頂向下的編碼拆分-解碼重構機制,將複雜智慧任務化繁爲簡,拆分爲多通道高並行的子任務,構建的分散式「大感受野」淺層光網路對子任務分而治之,突破物理模擬器件多層深度級聯的固有計算誤差。
團隊以周易典籍「易有太極,是生兩儀」爲啓發,建立干涉-衍射聯合傳播模型,融合衍射光計算大規模並行優勢與干涉光計算靈活重構特性,將衍射編解碼與干涉特徵計算進行部分/整體重構複用,以時序複用突破通量瓶頸,自底向上支撐分散式廣度光計算架構,爲片上大規模通用智慧光計算探索了新路徑。
通俗來講,干涉-衍射的組合方式彷彿就是在拼樂高玩具。樂高積木可以通過一個模組凹槽與另一個模組凸起的契合來完成兩個組件的拼接。在科研團隊眼中,一旦把干涉、衍射變成基礎模組,進行重構複用,可以憑藉豐富的想像力搭建出變化無窮的造型。
據論文報導:「太極」光晶片具備879 T MACS/mm²的面積效率與160 TOPS/W的能量效率,首次賦能光計算實現自然場景千類物件識別、跨模態內容生成等人工智慧複雜任務。
「太極」光晶片有望爲大模型訓練推理、通用人工智慧、自主智慧無人系統提供算力支撐。
方璐表示,「之所以將光晶片命名爲『太極』,也是希望可以在如今大模型通用人工智慧蓬勃發展的時代,以光子之道,爲高性能計算探索新靈感、新架構、新路徑 。」
北京資訊科學與技術國家研究中心的光電智慧技術交叉創新團隊由來自電子系、自動化系、積體電路學院、軟體學院的領域學者和專門研究人員組成。
方璐認爲,這次突破性科研成果的成功取得,是北京清華大學深入推進有組織科研的一次生動實踐。
該課題受到科技部2030「新一代人工智慧」重大項目、國家自然科學基金委傑青項目、基礎科學中心專案,清華大學-之江實驗室聯合研究中心支持。
在合作者中,有來自各個學科、不同背景的成員。集思廣益,多學科、多角度地探索更多解決途徑。