阿里通義千問技術骨幹周暢將離職創業 | 36氪獨家

作者 | 鄧詠儀 周鑫雨

編輯 | 蘇建勳 楊軒

36氪獨家獲悉,阿里通義千問大模型技術負責人周暢(花名:鍾煌)將從阿里雲離職,下場創業。

36氪瞭解到,周暢目前還在阿里雲系統中,尚未正式離職。但36氪從多方獨立信源處得知,周暢已確定要創業。一位消息人士對36氪表示,周暢或將投身於AI應用領域。

而另一位知情人士表示,周暢是通義實驗室算法團隊的核心技術骨幹之一,屬於正常離職。通義大模型的研發和開源工作還在進行中,目前通義實驗室負責人爲阿里雲CTO周靖人。

對於上述信息,36氪向阿里雲求證,截至發稿,暫無回覆。

周暢爲“通義千問”的大模型負責人,他於2012年本科畢業於復旦計算機科學與技術專業,2017年博士畢業於北京大學計算機軟件與理論專業,而後加入阿里巴巴。他先後在達摩院任職算法專家,再到通義千問的大模型負責人。其專攻領域爲深度學習、圖挖掘和分佈式計算,他在機器學習、數據挖掘、數據庫領域國際頂級會議上發表30餘篇文章,並擔任NeurIPS/ICML/KDD/WWW等學術會議的審稿人。

阿里是國內最早成體系地投入在大模型領域裡投入研發的大公司。2019年,阿里就在BERT路線的基礎上推出了預訓練大語言模型structBERT,而後在2021年推出了多模態大模型M6,再到如今的通義大模型家族。

達摩院下屬的通義實驗室,也是如今大模型圈內的“人才高地”。如前不久官宣創業的前字節模型技術研發負責人楊紅霞,已加入Salesforce的前任實驗室負責人司羅、通義視覺實驗室負責人徐盈輝等等,都出自達摩院體系,這都是培養起阿里大模型團隊的第一批頂尖AI人才。

周暢則是完整經歷過阿里大模型演變歷程的核心技術骨幹。在2020-2021年間,他帶領團隊設計並實現了超大規模的多模態預訓練模型M6,在參數數量和低碳訓練模式上曾取得突破。

而更早之前,他曾研發超大規模商品圖表徵算法APP、用戶表徵框架ATRank、基於自監督對比學習的向量召回算法CLRec系列,這些技術都有落地到實際應用場景中——比如在手淘多個個性化推薦場景下,讓效果獲得大幅提升。

進入2024年,國內大模型行業已經進入走過萌芽期,基礎大模型層已經格局出現——玩家包括大廠如阿里、字節、騰訊,創業公司如智譜AI、Minimax、月之暗面、百川智能等。市場普遍將關注度放在了AI應用一側,關注大模型如何落地到千行百業中,這也會帶動新一波AI人才的創業熱潮。