☰

和奧特曼最鐵的OpenAI聯合創始人，爲什麼離職？

最近關於OpenAI“散夥”的標題黨新聞刷屏了，也就我們瞭解的一些情況分享下。

目前公開的信息，是聯合創始人兼總裁GregBrockman休Sabbatical（學術休假）到年底，他自己也發了個twitter解釋；聯合創始人兼SuperAlignment負責人JohnSchulman離職並加入了Anthropic；去年加入的產品副總裁PeterDeng也離開了OpenAI。

Greg是最早的幾位cofounder之一，先擔任公司CTO，然後擔任了公司的總裁，一直是SamAltman最鐵的同伴，在去年11月的政變中，也非常支持Sam，在董事會解僱SamAltman幾小時後，他就直接選擇了辭職，也一直在幫助SamAltman串聯同事。並且Greg和Greg的太太，努力說服Ilya最終反對董事會，對結束政變起了非常大的作用。目前看起來，Greg休的是Sabbatical，這個是歐美公司和學界給資深員工的一種福利，每隔5-10年不等，可以休3個月到1年的帶薪假，因此是否是離職，目前還沒有明確的說法。

即使Greg離職，我們認爲，對於OpenAI未來模型的研究，包括GPT5和GPT6的實際影響也是可控的。Greg一直以來給人一種solocoder的感覺，大部分時候都是一個人在做開發，或者只帶很少的specialtaskforce。最早之所以會由Mira接管CTO，也是因爲Greg不喜歡管理團隊，只喜歡編程開發。

早期，Greg作爲超級工程大牛，奠定了從OpenAI從一開始，到GPT4的整個Infra基礎架構和模型訓練框架，傳說那時候他一個人手搓出了一半的Infracode。Greg還非常喜歡自己一個週末閉關放一個大招，比如引發巨大爭議的GPT3API，就是Greg自己一個週末寫出來的，然後週一交給團隊調試。ChatGPTPlugin也是類似的被Greg一個週末搞出來的。GPT4之後，Greg對於模型research參與的就比較少了，他的重心更多放在了產品開發，另外也會充當救火隊員，解決一些項目和工程的緊急問題。

同時，也有很多猜測，Greg的solo風格造成過一些OpenAI內部的分裂，比如Dario之所以帶領了一半GPT3的核心研究人員離開OpenAI並創立Anthropic，就是因爲Greg沒和團隊商量，就一個人搞出了GPT3API，可能造成模型安全的問題。而11月董事會之所以開除Sam，也猜測和Greg激進的推廣ChatGPTPlugin和GPTStore，而沒有嚴格遵守safetyreview有關。如果Greg最終離職，可能也是和這個因素有關。

真正離職的JohnSchulman，被稱爲ChatGPT之父，是Policy-basedRL領域的超級大神，以其在ProximalPolicyOptimization（PPO）和ReinforcementLearningfromHumanFeedback（RLHF）方面的開創性工作而聞名。他曾在加州大學伯克利分校獲得計算機科學博士學位，師從強化學習大佬PieterAbbeel，隨後在OpenAI擔任研究科學家，推動了多項關鍵技術的發展，尤其是PPO，是JohnSchulman及其團隊在2017年提出的一種新型強化學習算法。這一算法通過引入限制策略更新的變化範圍，從而顯著提高了強化學習算法的穩定性和效率，奠定了ChatGPT，乃至我們這波整個AGI浪潮的基礎。John也一直擔任OpenAIposttraining團隊的負責人，Ilya離職後也接任了SuperAlignmentTeam的leader（SuperAlignmentTeam感覺有點被詛咒了，兩人負責人都離職，重要成員JanLeike也離職了）。

John的離職，推測更有可能是文化和研究理念的不合。John一直和Ilya走得比較近，也是非常純粹的researcher，同時對於safety和alignment也有很強的追求。目前OpenAI逐漸從一個純粹的研究機構，向一家商業化公司轉變，SuperAlignment也是命運多舛。雖然John離開了，但是OpenAI的posttrainingteam還有非常多頂級天才的研究人員，相信他們會接過John的衣鉢，繼續探索AGI的未來。只是這個未來，是否還有人類存在的空間？

另外一個離職的高管Peter，1年前才加入，主要也是負責產品。OpenAI本身survive的難度很高，內部優勝劣汰非常殘酷，Peter應該也是比較正常的離職。他加入之後OpenAI推出的新產品都不能算很成功，尤其是GPTStore。

和奧特曼最鐵的OpenAI聯合創始人，爲什麼離職？

相關資訊