和奧特曼最鐵的OpenAI聯合創始人,爲什麼離職?

最近關於OpenAI“散夥”的標題黨新聞刷屏了,也就我們瞭解的一些情況分享下。

目前公開的信息,是聯合創始人兼總裁GregBrockman休Sabbatical(學術休假)到年底,他自己也發了個twitter解釋;聯合創始人兼SuperAlignment負責人JohnSchulman離職並加入了Anthropic;去年加入的產品副總裁PeterDeng也離開了OpenAI。

Greg是最早的幾位cofounder之一,先擔任公司CTO,然後擔任了公司的總裁,一直是SamAltman最鐵的同伴,在去年11月的政變中,也非常支持Sam,在董事會解僱SamAltman幾小時後,他就直接選擇了辭職,也一直在幫助SamAltman串聯同事。並且Greg和Greg的太太,努力說服Ilya最終反對董事會,對結束政變起了非常大的作用。目前看起來,Greg休的是Sabbatical,這個是歐美公司和學界給資深員工的一種福利,每隔5-10年不等,可以休3個月到1年的帶薪假,因此是否是離職,目前還沒有明確的說法。

即使Greg離職,我們認爲,對於OpenAI未來模型的研究,包括GPT5和GPT6的實際影響也是可控的。Greg一直以來給人一種solocoder的感覺,大部分時候都是一個人在做開發,或者只帶很少的specialtaskforce。最早之所以會由Mira接管CTO,也是因爲Greg不喜歡管理團隊,只喜歡編程開發。

早期,Greg作爲超級工程大牛,奠定了從OpenAI從一開始,到GPT4的整個Infra基礎架構和模型訓練框架,傳說那時候他一個人手搓出了一半的Infracode。Greg還非常喜歡自己一個週末閉關放一個大招,比如引發巨大爭議的GPT3API,就是Greg自己一個週末寫出來的,然後週一交給團隊調試。ChatGPTPlugin也是類似的被Greg一個週末搞出來的。GPT4之後,Greg對於模型research參與的就比較少了,他的重心更多放在了產品開發,另外也會充當救火隊員,解決一些項目和工程的緊急問題。

同時,也有很多猜測,Greg的solo風格造成過一些OpenAI內部的分裂,比如Dario之所以帶領了一半GPT3的核心研究人員離開OpenAI並創立Anthropic,就是因爲Greg沒和團隊商量,就一個人搞出了GPT3API,可能造成模型安全的問題。而11月董事會之所以開除Sam,也猜測和Greg激進的推廣ChatGPTPlugin和GPTStore,而沒有嚴格遵守safetyreview有關。如果Greg最終離職,可能也是和這個因素有關。

真正離職的JohnSchulman,被稱爲ChatGPT之父,是Policy-basedRL領域的超級大神,以其在ProximalPolicyOptimization(PPO)和ReinforcementLearningfromHumanFeedback(RLHF)方面的開創性工作而聞名。他曾在加州大學伯克利分校獲得計算機科學博士學位,師從強化學習大佬PieterAbbeel,隨後在OpenAI擔任研究科學家,推動了多項關鍵技術的發展,尤其是PPO,是JohnSchulman及其團隊在2017年提出的一種新型強化學習算法。這一算法通過引入限制策略更新的變化範圍,從而顯著提高了強化學習算法的穩定性和效率,奠定了ChatGPT,乃至我們這波整個AGI浪潮的基礎。John也一直擔任OpenAIposttraining團隊的負責人,Ilya離職後也接任了SuperAlignmentTeam的leader(SuperAlignmentTeam感覺有點被詛咒了,兩人負責人都離職,重要成員JanLeike也離職了)。

John的離職,推測更有可能是文化和研究理念的不合。John一直和Ilya走得比較近,也是非常純粹的researcher,同時對於safety和alignment也有很強的追求。目前OpenAI逐漸從一個純粹的研究機構,向一家商業化公司轉變,SuperAlignment也是命運多舛。雖然John離開了,但是OpenAI的posttrainingteam還有非常多頂級天才的研究人員,相信他們會接過John的衣鉢,繼續探索AGI的未來。只是這個未來,是否還有人類存在的空間?

另外一個離職的高管Peter,1年前才加入,主要也是負責產品。OpenAI本身survive的難度很高,內部優勝劣汰非常殘酷,Peter應該也是比較正常的離職。他加入之後OpenAI推出的新產品都不能算很成功,尤其是GPTStore。