☰

OpenAI未來猛料全曝光！奧特曼承認自己最大弱點是產品

奧特曼在OpenAI倫敦開發者日上的最新採訪，終於完整釋出！

40分鐘的採訪過程中，奧特曼除了聊OpenAI未來模型發展方向、Agent、和最尊敬的競爭對手（就是此前碎片式走漏風聲的幾個問題）外，還就Scaling Law、半導體供應鏈、基礎模型競爭成本、該僱傭什麼年齡段的員工等十多個問題進行了快問快答。

當被問及站在OpenAI CEO這個位置上，有什麼是他過去和現在都缺乏充分準備的。

奧特曼毫不避諱地表示：產品！

有趣的是，如果讓現年39歲的奧特曼回到23、24歲，他會考慮在垂直方向做一些AI相關的東西。

比如輔導人類學習的AI Tutors，或者AI律師、AI CAD工程師什麼的。

以下附上這場精彩採訪的採訪全文，部分段落在不更改其原意的基礎上有所刪改。

最後還有11個快問快答彩蛋～

Q1：當我們展望未來，未來OpenAI更多的是o1這樣的模型，還是說可以期待參數更大的模型？

A：我們當然希望全面推進，但推理模型這個方向對我們來說特別重要。我們寄希望於用推理來解決許多多年來我們期待去完成的事。

比如，推理模型能夠爲新的科學做出貢獻，幫助編寫難度係數很高的代碼——我認爲這在很大程度上能推動世界向前發展。

所以可以期待一下o系列模型的快速改進，這的意義將非常重大。

Q2：也是從OpenAI的未來計劃出發，您怎麼看待作爲非技術創始人通過開發無代碼工具來構建、拓展AI應用程序？

A：肯定會有那一天的。

我們的第一步是讓那些懂得寫代碼的人具備更高的生產力；但落到最後，還是希望提供真正高質量的無代碼工具。

目前已經有一些有意義的（無代碼）工具，但如果想完全用無代碼的方式來創建一家初創公司，還需假以時日。

Q3：有一個創始人提問說，當下，OpenAI顯然處於技術棧中的某個位置，OpenAI將會走多遠？如果花費大量時間來調整RAG系統，是不是一種浪費時間的行爲——因爲OpenAI終將在應用程序中涵蓋這一部分？

A：我們通常會回答說，OpenAI將盡最大努力，並且堅信我們一定會讓推出的模型變得越來越好。

如果你創建的是一家以“給小漏洞打補丁”爲生的公司，不管OpenAI是否順利、正確地推進工作，對你的影響都不是那麼大。

換個角度來說，如果你的公司會因爲“OpenAI的模型越來越好”而更加成功，你肯定會爲此感到高興的。

就比方說甲骨文公司偷偷跟你說，OpenAI的o4會強得突破你的想象，你絕對樂開花了。

當然了，如果你非要挑一個o1-preview表現得不好的領域去深耕，勉強以此爲基礎，那你肯定會覺得我們的下一代模型不會像想象中表現得那麼好。

——這就是我想告訴初創公司的。

我們相信，OpenAI身處的改進軌道相當陡峭，現在模型的缺陷將會被後來者解決和彌補。

Q4：從一個創始人的角度來看，OpenAI可能會在哪些地方（而不是另一些地方）取得成功？相信投資者們也很想了解這個問題，大家都不想投資虧錢。

A：OpenAI將創造出數萬億美元的市值，具體來說，是通過使用AI來構建以前覺得不可能或者不切實際的產品與服務，來創造出市值新高。

我們希望推出的模型非常棒，讓使用者無後顧之憂，只需要用它做想做的事情就是了。

在GPT-3.5的時代，95%的初創公司啊、人啊，都在打賭模型不會變得更好。

其實他們做的事情，我們早就預見GPT-4可以搞定，可以做得更好，不會再出現3.5時代模型會出的錯了。如果創業者/開發者們做的事只是補全某一代模型的某個缺點，你就會發現這個缺點越來越無足輕重。

難道大家已經忘了幾年前的模型表現多糟糕嗎？其實才過去沒幾年。

但是機會遍地都是，所以乍一看給現有模型打補丁是不錯的機會（所以就不去搞AI助教或者AI醫療顧問什麼的）。

所以我才說，一開始的時候，95%的人肯定認爲模型不會再改進，只有5%的人打賭模型會發展得越來越好。

不過我覺得現在的情況已經不是這樣了。

大家現在反而覺得GPT-3.5進化到GPT-4的速度會是一種常態，但事實並非如此。好在我們內部員工都非常勤奮，我們知道將會發生什麼。

Q5：軟銀孫正義說，AI每年都會創造9萬億美元的價值，這將抵消他所認爲的每年9萬億美元的支出。看到這個說法的時候，您怎麼想？

A：從數量級上來說，現在已經差不多了。AI顯然會導致大量資金支出，同時創造大量的價值。

這種情況發生在每一次大型技術革命的過程中，AI顯然是其中之一。

明年將是OpenAI向下一代系統大力推進的一年。

剛纔咱們談到什麼時候會出現無代碼軟件Agent，我無法給定一個準確的時間，但可以暢想一下，如果任何人都可以描述他們想要的整個公司的軟件，這將爲世界帶來多少經濟價值。

同樣的價值下，更廣泛、更容易獲得、更便宜，那將非常強大。

還有一些其他的例子，比如我之前提到的醫療保健和教育，這兩個領域對世界而言價值數萬億美元。

如果AI能夠真正以不同於以往的方式實現這一點，我認爲它帶來的經濟價值的具體數字根本不是重點，更別提導論到底是9萬億還是1萬億了。

但可以肯定，AI創造的價值確實令人難以置信。

Q6：開源是一種非常重要的方法。您如何看待開源在人工智能未來中的作用？OpenAI內部討論過“我們應該開源所有模型或其中某些模型”嗎？

A：毋庸置疑，開源模型在生態中非常重要，而且現在市面上也有非常好的開源模型。

但我認爲提供良好的服務和API也是有意義的——這很合理，人們會選擇適合自己的方式。

Q7：您如何看待當今Agent的定義？對你來說，Agent是什麼？

A：我沒有充分考慮過這個問題，但我可以給Agent一個長期任務，並且儘可能少地去監督它的執行過程。

Q7'：您認爲人們對Agent的看法其實是錯誤的嗎？

A：可能我們都沒有一個準確的瞭解，但我們都知道一些重要的指標。

比如人們在談論代表他們行事的AI Agent時，常常舉的例子是讓Agent去預定餐廳。Agent可能在線預訂，或者給餐廳打電話訂座。

確實，Agent可以幫忙做一些事節省時間。不過我認爲真正有趣的事，應該是讓Agent做一些人類不會或不能做的事。

打個比方，Agent不是打電話給具體某家餐廳訂座，而是聯繫300家餐廳，找出哪家最適合我。如果打過去的電話都是Agent接的，那就更酷了！因爲人類無法大規模並行推進這種事情。

再舉個更有趣的例子。

Agent可能更像一個非常聰明的同事，你和它合作一個需要耗時2天或2周項目，Agent可以自己執行，還做得很好，在必要的時候它會跟你溝通，最後交出一份出色的成果。

Q7''：這是否從根本上改變了SaaS的定價方式？SaaS通常按用戶數量定價（席位收費），但現在AI實際上在替代勞動力。你如何看待未來的定價方式？

A：我只能猜測一下，我真的不知道。

我可以想象一個世界，你可以要求說“我想要1/10/100個GPU不斷地爲我工作”，這就不會按席位收費，而是根據持續處理這個問題的計算量來定價。

Q7'''：我們是否需要爲Aengts的使用場景構建特定的模型？

A：它當然需要大量的基礎設施，但我覺得o1模型指出了通向能夠出色完成Agent任務的模型的道路。

Q8：每個人都說模型是貶值的資產，模型的商品化非常普遍。您對此有何迴應和思考？當你考慮到訓練模型所需的資本密集度不斷增加時，我們是否會發現“這個領域需要大量的資金，但實際上只有很少人能做到”會發生逆轉？

A：模型確實是貶值的資產，但這並不意味着它們不值訓練投入的成本。更別提你訓練模型的時候會產生積極的複合效應，讓你能更好地訓練下一個模型。

我們從模型中獲得的實際收入證明了這項投資的合理性——當然，並非所有人都能做到這一點，而且有很多人在訓練模型這件事上重複造輪子。

如果你訓練的模型落後，或者沒有一個有粘性和價值的產品，那麼的確可能很難獲得投資回報。

OpenAI非常幸運地擁有ChatGPT，擁有數億使用我們模型的用戶。

所以即便成本很高，我們也可以把這個天文數字分攤到大量用戶身上攤薄它。

Q9：隨着時間推移，OpenAI模型如何繼續保持差異化？你最想專注於擴展這種差異化的領域是什麼？

A：推理是我們當前最重要的關注領域，我認爲這將解鎖下一次在創造價值方面的巨大飛躍。

因此，我們將在各個方面改進模型，我們將進行多模態工作，並添加其他功能，我們認爲這些功能對人們希望使用這些模型的方式非常重要。

Q9'：你如何看待推理和多模態工作，包括挑戰和你想要實現的目標？

A：我希望它能順利實現。這顯然需要一些努力才能完成。

但是人類的嬰兒和幼兒時期，即擅長語言之前，仍然可以進行相當複雜的視覺推理。

Q9''：視覺能力將如何隨着o1的新推理範式而擴展？

A：在不劇透的情況下，我預計基於圖像的模型將迅猛發展。

你可以期待在圖像模型方面的快速進展。

Q10：OpenAI如何在覈心推理方面取得突破？除了Transformer之外，是否需要開始推動強化學習作爲一種途徑或其他新技術？

A：這是兩個問題：我們如何做到，以及Transformer之後是什麼。

首先，我們如何做到是我們的秘訣。

複製已知有效的東西真的很容易，原因之一是你有信心知道什麼是可能的。在研究人員做了一些事情之後，即使你不知道他們是如何做到的，你也可以去復刻它。這一點可以在GPT-4和o1的複製版中得到驗證。

真正困難的事情，也是我對OpenAI最自豪的事情，是我們反覆去做一些新的、完全未經驗證的事情。

很多機構、組織聲稱有能力能去做這樣的事，但實際上很少有真正做到的，包括AI領域之外。

從某種意義上說，我認爲這是對人類進步最重要的投入之一。

我期待在退休後想寫一本書，一本介紹我學到了些什麼的書，分享我如何建立一個能夠做到這一點的組織和公司文化的經驗（而不是一個單純複製他人成果的組織）。

我認爲世界需要更多這樣的組織，雖然它的數量會被人類才智所限。

但現實情況是有大量人才被浪費了，因爲這個世界不擅長建立這樣的組織。但我還是希望有更多這樣的組織。

Q11：人才是如何被浪費的？

A：世界上有很多有才的人，但因爲他們在糟糕的公司工作，或者一些其它原因吧，沒辦法充分發揮他們的潛力。

我對AI最興奮的一個點，就是我希望它能讓我們更好地幫助每個人來發揮最大潛力。

這個目標遠遠沒有達成。

我敢肯定，如果世界上很多人的人生軌跡稍有不同，他們都會是出色的AI研究人員。

Q12：在過去的幾年裡，你有一段令人難以置信的經歷，（帶領出）令人難以置信的高速增長。你提到退休時會寫回憶錄，那麼當你回顧過去10年，你的領導方式有了什麼樣的顯著變化？

A：對我而言，這幾年最不同尋常的就是事情變化的速度。

在一家常規的公司，你有充足的時間去實現從0到1億美元的營收，再從1億到10億，一直到100億。你無需在兩年內達成這個過程。我們確實並非傳統意義上的硅谷初創公司，

我們不得不如此迅速地達成這一目標，有很多東西我本該花費更多時間去學習（但沒有去學習）。

Q12'：有什麼東西是你不知道，且本希望花更多時間去學習的？

A：我說一個吧，就是“讓公司專注於如何增長下一個10倍”，而不是增長10%。

這需要付出多大的努力？這件事有多困難？

如果是增長下一個10%，之前的有效的東西會仍然有效。但要讓一家營收10億美元的公司增長到營收100億美元，那就不能簡單重複之前做的事，而是需要大量的變革。

在一個人們甚至沒有時間掌握基礎知識的世界中，因爲增長太快，我嚴重低估了馬不停蹄向前衝刺到下一步所需付出的努力，同時又沒有忽視我們必須做的其它一切。

Q13：Keith Rabois（硅谷投資人，Paypal前副總裁）說你應該僱傭非常年輕的、30 歲以下的人，這是彼得·蒂爾（Peter Thiel，Paypal創始人）教給他的建立偉大公司的秘訣。我很好奇，你如何看待這種觀點？你如何平衡僱傭年輕的有活力但缺乏經驗的人，與那些更有經驗的人？

A：我們創辦OpenAI的時候，我就30歲左右，並不是特別特別年輕。

但目前爲止，OpenAI的進展似乎還不錯～

Q13'：你如何看待僱用30歲以下的人來工作？他們年輕、精力充沛、雄心勃勃，但經驗較少（有的可能也很豐富）？

A：顯而易見，答案是你可以通過僱傭兩類人來取得成功。

我們的團隊最近僱用了一個年輕人，他的工作令人驚歎。我都不懂這些人怎麼能在如此年輕的時候把工作幹得這麼漂亮？！但這就是事實。

如果你能找到這樣的人，他們會帶來令人驚歎的新視角、能量等等。

另一方面，當設計一些人類有史以來最爲複雜、最爲昂貴的計算機系統時，我可不願意押注於一個剛剛起步的人。

所以需要兩者兼具。

我認爲你真正想要的是一個由任何年齡段的人組成的極高人才標準，以及一個策略，即我只會僱用年輕人，或者我只會僱用年長的人。

我對 Y Combinator最感激的事情之一是“缺乏經驗並不意味着沒有價值”。

有一些非常有潛力的人在職業生涯的初期就可以創造巨大的價值，我們應該把賭注押在這些人身上，這是一件偉大的事情。

Q15：有人跟我說，有時候Anthropic的模型更適合編碼任務，這是爲什麼？你認爲這種評價公正嗎？開發者該在什麼時候選擇OpenAI而不是其他模型廠商呢？

A：沒錯，Anthropic有一個非常擅長寫代碼的模型，令人印象深刻。

我認爲開發者大多數時候都會使用好幾個模型，而且隨着Agent的作用越來越大，我不知道未來會如何發展。

我認爲AI將無處不在，而我們目前談論或思考它的方式感覺不太對。如果我必須描述清楚，我們會從討論模型轉向討論系統，但這需要一些時間。

Q16：當我們考慮scale模型時，你認爲在多少次模型迭代內，Scaling Law（縮放定律）仍將適用？人們普遍認爲它不會持續太久，但它似乎持續的時間比人們想象的要長。

A：我理解這個問題的核心是“模型能力的改進是否會像過去那樣？”

我相信答案是肯定的，並且會持續很長時間。

Q16'：你懷疑過這件事嗎？

A：完全沒有。

Q16''：爲什麼？

A：我們遇到過我們不理解的行爲，比如失敗的訓練運行，或其它各種各樣的事情。

當我們接近一個範式的結束時，不得不想出下一個範式。

Q16'''：哪一個是最難駕馭的？

A：當時研究GPT-4的時候，有一個問題非常棘手，我們真不知道怎麼解決它。

雖然最後找到了解決辦法，但很長一段時間我們都不知道該如何推進這個項目。

後來我們轉向我們長期以來感興趣的方向，就是o1和推理模型，但在此之前經歷了一條漫長而曲折的研究之路。

Q17：訓練和運行都可能失敗，保持士氣是不是一件困難的事？你會如何保持/提振士氣？

A：像你知道的那樣，我們很多員工都對構建AGI這事兒是非興奮，這是非常直接的動力。

沒有人期望通往成功的這條路是輕鬆的、直線的。

有句話說得好，大概是說“我從不祈禱上帝站在我這邊，我從來都是祈禱並希望自己站到上帝那邊”。

在某種程度上，押注深度學習感覺就像站在了天使那側，儘管你沿途會遇到一些大的絆腳石，但最終會發現它似乎總是會奏效。

因此，對此有深刻的信念對團隊保持士氣十分有利。

Q18：我可以問一個非常奇怪的問題嗎？我最近聽到一句很棒的話，“生活中最沉重的東西不是鐵或金，而是未做出的決定”。哪一個未做出的決定最讓你煩惱？

A：我每天做（及沒做）的決定都不太一樣，但沒有一個是“大的”決定。

有一些重大的事情，比如是否會押注於下一個產品，或者我們是否會喜歡以這種或那種方式構建我們的下一臺計算機——這些都有點像高風險的單向傳送門，我會像其他人一樣拖延很久。

但大多數情況下，困難的是每天都有些事情在投票比例爲51:49的情況下讓我最終拍板。這些事可能本身就是51:49的，而且我不覺得我能比其他人做得更好，但我又必須做最終決定。

Q18'：當你要對這些51:49的事做決策時，你通常會打電話給誰？

A：沒具體的誰。

如果做一切事情都要依靠一個人，我覺得是錯誤的。對我來說，正確的做法是有15或20個人爲我建議，他們中每一個都在特定的領域有良好的直覺或背景。

你可以給（某個領域）最好的專家打電話諮詢，而不是在各個方面都只依賴一個人。

Q19：接下來我想談談半導體供應鏈。你對半導體供應鏈有多擔心？

A：我不知道如何量化這個擔憂。

不可否認對它是擔心的，但這不是我的首要擔憂，但它在所有擔憂的前10%之內。

我們已經陷入了太多的麻煩，已經超過了爲此擔心的階段。

在某種程度上，我認爲這一切都會順利進行，但現在感覺有一個非常複雜的系統，每個層面都各自運作。在OpenAI內部也是如此，在任何一個團隊內部都是如此。

舉個半導體的例子，你必須平衡電源可用性與正確的網絡決策，以及能夠及時獲得足夠的芯片，以及研究可能存在的任何風險並備好與之相交，這樣你就不會被完全措手不及，或者手裡拿着一個無法利用的系統。

“供應鏈”聽起來太像一個pipeline了，但每個層次上的、整體生態系統的複雜性，是我在任何行業中前所未見的。

怎麼說呢，這可能是我最大的擔憂。

Q20：很多人把這一波AI浪潮與互聯網相比較，尤其是在興奮和熱情方面。我覺得兩者所耗費的金額還是有些不同。拉里·埃裡森（甲骨文公司創始人）說進入基礎模型競賽的起點將花費1000億美元，你同意這個說法嗎？這是合理的嗎？

A：不，我認爲會花費更少。

在基礎模型領域競爭的成本將不到1000億美元。

一個有趣的現象是，每個人都喜歡用此前的技術革命作爲例子，來談論新的技術。我認爲這是一個不好的習慣，但我理解人們爲什麼這樣做。

在我眼中，人們用來類比AI的例子特別糟糕，顯而易見的，互聯網和AI非常不同。

你提到一個關於成本的事情，以及是否需要花費1000億美元來競爭，但互聯網革命的特徵是那時候起步真的很容易，而且對不少公司來說，這一波浪潮只是互聯網的延續。

就像有人制造了這些AI模型，你可以使用它們來構建各種偉大的東西；但如果你試圖構建AI本身，那就完全不同了。

人們常用來類比AI的另一個例子是電力。出於很多原因，我覺得這也不合理。

我最喜歡用來類比的例子是晶體管。

這是一項新的物理髮現，它具有令人難以置信的縮放特性，很快就滲透到了各個地方。

我們現在可以想象到摩爾定律之類的東西，就像人工智能的一系列定律告訴我們它會以多快的速度變得更好。

每個人都受益於它，整個科技行業都受益於它。產品和服務中有很多晶體管，但你並不真正將它們視爲晶體管公司。

這是一個非常複雜、非常昂貴的工業過程，具有龐大的供應鏈。

基於這個非常簡單的物理髮現，帶來了長期的巨大經濟增長——儘管大多數時候你並沒有考慮它。

你不會說“這是一個晶體管產品”，只會覺得“OK，這東西可以爲我處理信息”。

你甚至會理所當然地忽視晶體管的存在。

Q1：如果你現在20歲出頭，使用我們今天的基礎設施，你會選擇做什麼？

A：某個AI支持的垂直領域，我會選擇AI助教，或者我能想象到的最好的AI律師、AI醫療顧問，任何類似的東西。

Q2：如果你要寫一本書，你會給它取什麼名字？

A：我還沒有準備好標題，除了部分我想寫的東西，我還沒有完整構想過這本書。

不過我認爲它會與人類潛力有關。

Q3：在AI領域，有什麼是沒受到足夠關注，但每個人都應該花更多時間在上面的？

A：某種能夠理解你整個生活的AI，我希望看到有很多不同的方法可以解決這個問題。

並不一定需要真的有無限的上下文，但以某種方式，你可以擁有一個知道關於你的所有事情、可以訪問你的所有數據的AI Agent。

Q4：上個月有什麼事情讓你感到驚訝，Sam？

A：一個我不能談論的研究成果，但它好得令人震驚。

Q5：你最尊敬哪位競爭對手？爲什麼是他們？

A：我想說，我尊敬目前這個領域的每個人。

我認爲整個領域充滿了才華橫溢、非常努力的人。

我不是在迴避問題，我可以指出每個地方都有超級有才華的人，做着超級出色的工作。

Q6：告訴我，你最喜歡的OpenAI API是什麼？

A：我認爲新的實時API非常棒，我們現在有一個龐大的API 業務，裡面有很多好東西。

Q7：你今天最尊敬AI領域的誰？

A：讓我向Cursor團隊致敬。

有很多人在AI方面做着令人難以置信的工作，但在使用AI、讓AI提供真正神奇的體驗、創造大量價值的方面，Cursor以人們之前沒有想到的方式將這些部分拼湊在一起，我認爲這是非常了不起的。

這個答案排除了OpenAI裡的人，不然我得說出一長串名字。

Q8：你如何看待延遲和準確性之間的權衡？

A：需要一個在延遲和準確性之間的刻度標準。我們正在做快問快答，我沒有特意加快速度，但也儘量不想太久。

在這種情況下，你想要的是（降低）延遲。如果換成想在物理學上做出新的重要發現，就願意多等待幾年。

答案是，應該由用戶控制這個權衡。

Q9：我相信每個人都會對自己的領導力感到不安，這種情況下，以及您希望改進自己的領導力領域時，作爲OpenAI的領導者、CEO，您最希望改進哪些方面？

A：這是一個很長的清單……我試圖釐清排名第一的是哪一個。

這周最困擾我的事情是，我對我們產品策略的細節比過去還要不確定。

我認爲該產品總體上是我的弱點，現在公司需要我在這方面有更強大、更清晰的願景。

我們有一位出色的產品主管和一支出色的產品團隊，但我希望在這個領域我能更強大。

Q10：你僱用了Kevin Weil（來擔任CPO），我認識Kevin很多年了，他非常出色。是什麼讓你覺得Kevin是世界級的產品領導者？

A：“紀律”是我想到的第一個詞。

我們將專注於我們要說“不”的事情，真正試圖代表用戶說爲什麼我們要做或不做某件事，真正努力不抱有幻想。

Q11：Sam，你接受了很多采訪。

最後我想談一談，我們對OpenAI有五年的展望和十年的展望。

A：如果我們是對的，我們可以輕鬆地在接下來兩年內開始製造系統，幫助科學進步。

五年後，OpenAI的技術進步速度會快到令人難以置信，完全可以用瘋狂來描述。

第二點是，社會本身的變化實際上很小。

就像五年前問大家計算機是否會通過圖靈測試，大家都會搖頭。

如果你說一個神諭告訴你會怎麼怎麼樣，他們會說：oh，這將會是一個瘋狂的、驚人的社會變化。

而現在，我們確實通過了圖靈測試，而且社會並沒有發生太大的變化。

一切只是呼嘯而過。

我期望不斷髮生的事情就是進步，科學進步，不斷前進，以一種我認爲良好和健康的方式超越所有期望，同時社會變化並沒有那麼大。

（完）

參考鏈接：https://www.youtube.com/watch?v=peg-aX1oii4

OpenAI未來猛料全曝光！奧特曼承認自己最大弱點是產品

相關資訊