OpenAI未來猛料全曝光!奧特曼承認自己最大弱點是產品

奧特曼在OpenAI倫敦開發者日上的最新採訪,終於完整釋出!

40分鐘的採訪過程中,奧特曼除了聊OpenAI未來模型發展方向、Agent、和最尊敬的競爭對手(就是此前碎片式走漏風聲的幾個問題)外,還就Scaling Law、半導體供應鏈、基礎模型競爭成本、該僱傭什麼年齡段的員工等十多個問題進行了快問快答。

當被問及站在OpenAI CEO這個位置上,有什麼是他過去和現在都缺乏充分準備的。

奧特曼毫不避諱地表示:產品!

有趣的是,如果讓現年39歲的奧特曼回到23、24歲,他會考慮在垂直方向做一些AI相關的東西。

比如輔導人類學習的AI Tutors,或者AI律師、AI CAD工程師什麼的。

以下附上這場精彩採訪的採訪全文,部分段落在不更改其原意的基礎上有所刪改。

最後還有11個快問快答彩蛋~

Q1:當我們展望未來,未來OpenAI更多的是o1這樣的模型,還是說可以期待參數更大的模型?

A:我們當然希望全面推進,但推理模型這個方向對我們來說特別重要。我們寄希望於用推理來解決許多多年來我們期待去完成的事。

比如,推理模型能夠爲新的科學做出貢獻,幫助編寫難度係數很高的代碼——我認爲這在很大程度上能推動世界向前發展。

所以可以期待一下o系列模型的快速改進,這的意義將非常重大。

Q2:也是從OpenAI的未來計劃出發,您怎麼看待作爲非技術創始人通過開發無代碼工具來構建、拓展AI應用程序?

A:肯定會有那一天的。

我們的第一步是讓那些懂得寫代碼的人具備更高的生產力;但落到最後,還是希望提供真正高質量的無代碼工具。

目前已經有一些有意義的(無代碼)工具,但如果想完全用無代碼的方式來創建一家初創公司,還需假以時日。

Q3:有一個創始人提問說,當下,OpenAI顯然處於技術棧中的某個位置,OpenAI將會走多遠?如果花費大量時間來調整RAG系統,是不是一種浪費時間的行爲——因爲OpenAI終將在應用程序中涵蓋這一部分?

A:我們通常會回答說,OpenAI將盡最大努力,並且堅信我們一定會讓推出的模型變得越來越好。

如果你創建的是一家以“給小漏洞打補丁”爲生的公司,不管OpenAI是否順利、正確地推進工作,對你的影響都不是那麼大。

換個角度來說,如果你的公司會因爲“OpenAI的模型越來越好”而更加成功,你肯定會爲此感到高興的。

就比方說甲骨文公司偷偷跟你說,OpenAI的o4會強得突破你的想象,你絕對樂開花了。

當然了,如果你非要挑一個o1-preview表現得不好的領域去深耕,勉強以此爲基礎,那你肯定會覺得我們的下一代模型不會像想象中表現得那麼好。

——這就是我想告訴初創公司的。

我們相信,OpenAI身處的改進軌道相當陡峭,現在模型的缺陷將會被後來者解決和彌補。

Q4:從一個創始人的角度來看,OpenAI可能會在哪些地方(而不是另一些地方)取得成功?相信投資者們也很想了解這個問題,大家都不想投資虧錢。

A:OpenAI將創造出數萬億美元的市值,具體來說,是通過使用AI來構建以前覺得不可能或者不切實際的產品與服務,來創造出市值新高。

我們希望推出的模型非常棒,讓使用者無後顧之憂,只需要用它做想做的事情就是了。

在GPT-3.5的時代,95%的初創公司啊、人啊,都在打賭模型不會變得更好。

其實他們做的事情,我們早就預見GPT-4可以搞定,可以做得更好,不會再出現3.5時代模型會出的錯了。如果創業者/開發者們做的事只是補全某一代模型的某個缺點,你就會發現這個缺點越來越無足輕重。

難道大家已經忘了幾年前的模型表現多糟糕嗎?其實才過去沒幾年。

但是機會遍地都是,所以乍一看給現有模型打補丁是不錯的機會(所以就不去搞AI助教或者AI醫療顧問什麼的)。

所以我才說,一開始的時候,95%的人肯定認爲模型不會再改進,只有5%的人打賭模型會發展得越來越好。

不過我覺得現在的情況已經不是這樣了。

大家現在反而覺得GPT-3.5進化到GPT-4的速度會是一種常態,但事實並非如此。好在我們內部員工都非常勤奮,我們知道將會發生什麼。

Q5:軟銀孫正義說,AI每年都會創造9萬億美元的價值,這將抵消他所認爲的每年9萬億美元的支出。看到這個說法的時候,您怎麼想?

A:從數量級上來說,現在已經差不多了。AI顯然會導致大量資金支出,同時創造大量的價值。

這種情況發生在每一次大型技術革命的過程中,AI顯然是其中之一。

明年將是OpenAI向下一代系統大力推進的一年。

剛纔咱們談到什麼時候會出現無代碼軟件Agent,我無法給定一個準確的時間,但可以暢想一下,如果任何人都可以描述他們想要的整個公司的軟件,這將爲世界帶來多少經濟價值。

同樣的價值下,更廣泛、更容易獲得、更便宜,那將非常強大。

還有一些其他的例子,比如我之前提到的醫療保健和教育,這兩個領域對世界而言價值數萬億美元。

如果AI能夠真正以不同於以往的方式實現這一點,我認爲它帶來的經濟價值的具體數字根本不是重點,更別提導論到底是9萬億還是1萬億了。

但可以肯定,AI創造的價值確實令人難以置信。

Q6:開源是一種非常重要的方法。您如何看待開源在人工智能未來中的作用?OpenAI內部討論過“我們應該開源所有模型或其中某些模型”嗎?

A:毋庸置疑,開源模型在生態中非常重要,而且現在市面上也有非常好的開源模型。

但我認爲提供良好的服務和API也是有意義的——這很合理,人們會選擇適合自己的方式。

Q7:您如何看待當今Agent的定義?對你來說,Agent是什麼?

A:我沒有充分考慮過這個問題,但我可以給Agent一個長期任務,並且儘可能少地去監督它的執行過程。

Q7':您認爲人們對Agent的看法其實是錯誤的嗎?

A:可能我們都沒有一個準確的瞭解,但我們都知道一些重要的指標。

比如人們在談論代表他們行事的AI Agent時,常常舉的例子是讓Agent去預定餐廳。Agent可能在線預訂,或者給餐廳打電話訂座。

確實,Agent可以幫忙做一些事節省時間。不過我認爲真正有趣的事,應該是讓Agent做一些人類不會或不能做的事。

打個比方,Agent不是打電話給具體某家餐廳訂座,而是聯繫300家餐廳,找出哪家最適合我。如果打過去的電話都是Agent接的,那就更酷了!因爲人類無法大規模並行推進這種事情。

再舉個更有趣的例子。

Agent可能更像一個非常聰明的同事,你和它合作一個需要耗時2天或2周項目,Agent可以自己執行,還做得很好,在必要的時候它會跟你溝通,最後交出一份出色的成果。

Q7'':這是否從根本上改變了SaaS的定價方式?SaaS通常按用戶數量定價(席位收費),但現在AI實際上在替代勞動力。你如何看待未來的定價方式?

A:我只能猜測一下,我真的不知道。

我可以想象一個世界,你可以要求說“我想要1/10/100個GPU不斷地爲我工作”,這就不會按席位收費,而是根據持續處理這個問題的計算量來定價。

Q7''':我們是否需要爲Aengts的使用場景構建特定的模型?

A:它當然需要大量的基礎設施,但我覺得o1模型指出了通向能夠出色完成Agent任務的模型的道路。

Q8:每個人都說模型是貶值的資產,模型的商品化非常普遍。您對此有何迴應和思考?當你考慮到訓練模型所需的資本密集度不斷增加時,我們是否會發現“這個領域需要大量的資金,但實際上只有很少人能做到”會發生逆轉?

A:模型確實是貶值的資產,但這並不意味着它們不值訓練投入的成本。更別提你訓練模型的時候會產生積極的複合效應,讓你能更好地訓練下一個模型。

我們從模型中獲得的實際收入證明了這項投資的合理性——當然,並非所有人都能做到這一點,而且有很多人在訓練模型這件事上重複造輪子。

如果你訓練的模型落後,或者沒有一個有粘性和價值的產品,那麼的確可能很難獲得投資回報。

OpenAI非常幸運地擁有ChatGPT,擁有數億使用我們模型的用戶。

所以即便成本很高,我們也可以把這個天文數字分攤到大量用戶身上攤薄它。

Q9:隨着時間推移,OpenAI模型如何繼續保持差異化?你最想專注於擴展這種差異化的領域是什麼?

A:推理是我們當前最重要的關注領域,我認爲這將解鎖下一次在創造價值方面的巨大飛躍。

因此,我們將在各個方面改進模型,我們將進行多模態工作,並添加其他功能,我們認爲這些功能對人們希望使用這些模型的方式非常重要。

Q9':你如何看待推理和多模態工作,包括挑戰和你想要實現的目標?

A:我希望它能順利實現。這顯然需要一些努力才能完成。

但是人類的嬰兒和幼兒時期,即擅長語言之前,仍然可以進行相當複雜的視覺推理。

Q9'':視覺能力將如何隨着o1的新推理範式而擴展?

A:在不劇透的情況下,我預計基於圖像的模型將迅猛發展。

你可以期待在圖像模型方面的快速進展。

Q10:OpenAI如何在覈心推理方面取得突破?除了Transformer之外,是否需要開始推動強化學習作爲一種途徑或其他新技術?

A:這是兩個問題:我們如何做到,以及Transformer之後是什麼。

首先,我們如何做到是我們的秘訣。

複製已知有效的東西真的很容易,原因之一是你有信心知道什麼是可能的。在研究人員做了一些事情之後,即使你不知道他們是如何做到的,你也可以去復刻它。這一點可以在GPT-4和o1的複製版中得到驗證。

真正困難的事情,也是我對OpenAI最自豪的事情,是我們反覆去做一些新的、完全未經驗證的事情。

很多機構、組織聲稱有能力能去做這樣的事,但實際上很少有真正做到的,包括AI領域之外。

從某種意義上說,我認爲這是對人類進步最重要的投入之一。

我期待在退休後想寫一本書,一本介紹我學到了些什麼的書,分享我如何建立一個能夠做到這一點的組織和公司文化的經驗(而不是一個單純複製他人成果的組織)。

我認爲世界需要更多這樣的組織,雖然它的數量會被人類才智所限。

但現實情況是有大量人才被浪費了,因爲這個世界不擅長建立這樣的組織。但我還是希望有更多這樣的組織。

Q11:人才是如何被浪費的?

A:世界上有很多有才的人,但因爲他們在糟糕的公司工作,或者一些其它原因吧,沒辦法充分發揮他們的潛力。

我對AI最興奮的一個點,就是我希望它能讓我們更好地幫助每個人來發揮最大潛力。

這個目標遠遠沒有達成。

我敢肯定,如果世界上很多人的人生軌跡稍有不同,他們都會是出色的AI研究人員。

Q12:在過去的幾年裡,你有一段令人難以置信的經歷,(帶領出)令人難以置信的高速增長。你提到退休時會寫回憶錄,那麼當你回顧過去10年,你的領導方式有了什麼樣的顯著變化?

A:對我而言,這幾年最不同尋常的就是事情變化的速度。

在一家常規的公司,你有充足的時間去實現從0到1億美元的營收,再從1億到10億,一直到100億。你無需在兩年內達成這個過程。我們確實並非傳統意義上的硅谷初創公司,

我們不得不如此迅速地達成這一目標,有很多東西我本該花費更多時間去學習(但沒有去學習)。

Q12':有什麼東西是你不知道,且本希望花更多時間去學習的?

A:我說一個吧,就是“讓公司專注於如何增長下一個10倍”,而不是增長10%。

這需要付出多大的努力?這件事有多困難?

如果是增長下一個10%,之前的有效的東西會仍然有效。但要讓一家營收10億美元的公司增長到營收100億美元,那就不能簡單重複之前做的事,而是需要大量的變革。

在一個人們甚至沒有時間掌握基礎知識的世界中,因爲增長太快,我嚴重低估了馬不停蹄向前衝刺到下一步所需付出的努力,同時又沒有忽視我們必須做的其它一切。

Q13:Keith Rabois(硅谷投資人,Paypal前副總裁)說你應該僱傭非常年輕的、30 歲以下的人,這是彼得·蒂爾(Peter Thiel,Paypal創始人)教給他的建立偉大公司的秘訣。我很好奇,你如何看待這種觀點?你如何平衡僱傭年輕的有活力但缺乏經驗的人,與那些更有經驗的人?

A:我們創辦OpenAI的時候,我就30歲左右,並不是特別特別年輕。

但目前爲止,OpenAI的進展似乎還不錯~

Q13':你如何看待僱用30歲以下的人來工作?他們年輕、精力充沛、雄心勃勃,但經驗較少(有的可能也很豐富)?

A:顯而易見,答案是你可以通過僱傭兩類人來取得成功。

我們的團隊最近僱用了一個年輕人,他的工作令人驚歎。我都不懂這些人怎麼能在如此年輕的時候把工作幹得這麼漂亮?!但這就是事實。

如果你能找到這樣的人,他們會帶來令人驚歎的新視角、能量等等。

另一方面,當設計一些人類有史以來最爲複雜、最爲昂貴的計算機系統時,我可不願意押注於一個剛剛起步的人。

所以需要兩者兼具。

我認爲你真正想要的是一個由任何年齡段的人組成的極高人才標準,以及一個策略,即我只會僱用年輕人,或者我只會僱用年長的人。

我對 Y Combinator最感激的事情之一是“缺乏經驗並不意味着沒有價值”。

有一些非常有潛力的人在職業生涯的初期就可以創造巨大的價值,我們應該把賭注押在這些人身上,這是一件偉大的事情。

Q15:有人跟我說,有時候Anthropic的模型更適合編碼任務,這是爲什麼?你認爲這種評價公正嗎?開發者該在什麼時候選擇OpenAI而不是其他模型廠商呢?

A:沒錯,Anthropic有一個非常擅長寫代碼的模型,令人印象深刻。

我認爲開發者大多數時候都會使用好幾個模型,而且隨着Agent的作用越來越大,我不知道未來會如何發展。

我認爲AI將無處不在,而我們目前談論或思考它的方式感覺不太對。如果我必須描述清楚,我們會從討論模型轉向討論系統,但這需要一些時間。

Q16:當我們考慮scale模型時,你認爲在多少次模型迭代內,Scaling Law(縮放定律)仍將適用?人們普遍認爲它不會持續太久,但它似乎持續的時間比人們想象的要長。

A:我理解這個問題的核心是“模型能力的改進是否會像過去那樣?”

我相信答案是肯定的,並且會持續很長時間。

Q16':你懷疑過這件事嗎?

A:完全沒有。

Q16'':爲什麼?

A:我們遇到過我們不理解的行爲,比如失敗的訓練運行,或其它各種各樣的事情。

當我們接近一個範式的結束時,不得不想出下一個範式。

Q16''':哪一個是最難駕馭的?

A:當時研究GPT-4的時候,有一個問題非常棘手,我們真不知道怎麼解決它。

雖然最後找到了解決辦法, 但很長一段時間我們都不知道該如何推進這個項目。

後來我們轉向我們長期以來感興趣的方向,就是o1和推理模型,但在此之前經歷了一條漫長而曲折的研究之路。

Q17:訓練和運行都可能失敗,保持士氣是不是一件困難的事?你會如何保持/提振士氣?

A:像你知道的那樣,我們很多員工都對構建AGI這事兒是非興奮,這是非常直接的動力。

沒有人期望通往成功的這條路是輕鬆的、直線的。

有句話說得好,大概是說“我從不祈禱上帝站在我這邊,我從來都是祈禱並希望自己站到上帝那邊”。

在某種程度上,押注深度學習感覺就像站在了天使那側,儘管你沿途會遇到一些大的絆腳石,但最終會發現它似乎總是會奏效。

因此,對此有深刻的信念對團隊保持士氣十分有利。

Q18:我可以問一個非常奇怪的問題嗎?我最近聽到一句很棒的話,“生活中最沉重的東西不是鐵或金,而是未做出的決定”。哪一個未做出的決定最讓你煩惱?

A:我每天做(及沒做)的決定都不太一樣,但沒有一個是“大的”決定。

有一些重大的事情,比如是否會押注於下一個產品,或者我們是否會喜歡以這種或那種方式構建我們的下一臺計算機——這些都有點像高風險的單向傳送門,我會像其他人一樣拖延很久。

但大多數情況下,困難的是每天都有些事情在投票比例爲51:49的情況下讓我最終拍板。這些事可能本身就是51:49的,而且我不覺得我能比其他人做得更好,但我又必須做最終決定。

Q18':當你要對這些51:49的事做決策時,你通常會打電話給誰?

A:沒具體的誰。

如果做一切事情都要依靠一個人,我覺得是錯誤的。對我來說,正確的做法是有15或20個人爲我建議,他們中每一個都在特定的領域有良好的直覺或背景。

你可以給(某個領域)最好的專家打電話諮詢,而不是在各個方面都只依賴一個人。

Q19:接下來我想談談半導體供應鏈。你對半導體供應鏈有多擔心?

A:我不知道如何量化這個擔憂。

不可否認對它是擔心的,但這不是我的首要擔憂,但它在所有擔憂的前10%之內。

我們已經陷入了太多的麻煩,已經超過了爲此擔心的階段。

在某種程度上,我認爲這一切都會順利進行,但現在感覺有一個非常複雜的系統,每個層面都各自運作。在OpenAI內部也是如此,在任何一個團隊內部都是如此。

舉個半導體的例子,你必須平衡電源可用性與正確的網絡決策,以及能夠及時獲得足夠的芯片,以及研究可能存在的任何風險並備好與之相交,這樣你就不會被完全措手不及,或者手裡拿着一個無法利用的系統。

“供應鏈”聽起來太像一個pipeline了,但每個層次上的、整體生態系統的複雜性,是我在任何行業中前所未見的。

怎麼說呢,這可能是我最大的擔憂。

Q20:很多人把這一波AI浪潮與互聯網相比較,尤其是在興奮和熱情方面。我覺得兩者所耗費的金額還是有些不同。拉里·埃裡森(甲骨文公司創始人)說進入基礎模型競賽的起點將花費1000億美元,你同意這個說法嗎?這是合理的嗎?

A:不,我認爲會花費更少。

在基礎模型領域競爭的成本將不到1000億美元。

一個有趣的現象是,每個人都喜歡用此前的技術革命作爲例子,來談論新的技術。我認爲這是一個不好的習慣,但我理解人們爲什麼這樣做。

在我眼中,人們用來類比AI的例子特別糟糕,顯而易見的,互聯網和AI非常不同。

你提到一個關於成本的事情,以及是否需要花費1000億美元來競爭,但互聯網革命的特徵是那時候起步真的很容易,而且對不少公司來說,這一波浪潮只是互聯網的延續。

就像有人制造了這些AI模型,你可以使用它們來構建各種偉大的東西;但如果你試圖構建AI本身,那就完全不同了。

人們常用來類比AI的另一個例子是電力。出於很多原因,我覺得這也不合理。

我最喜歡用來類比的例子是晶體管。

這是一項新的物理髮現,它具有令人難以置信的縮放特性,很快就滲透到了各個地方。

我們現在可以想象到摩爾定律之類的東西,就像人工智能的一系列定律告訴我們它會以多快的速度變得更好。

每個人都受益於它,整個科技行業都受益於它。產品和服務中有很多晶體管,但你並不真正將它們視爲晶體管公司。

這是一個非常複雜、非常昂貴的工業過程,具有龐大的供應鏈。

基於這個非常簡單的物理髮現,帶來了長期的巨大經濟增長——儘管大多數時候你並沒有考慮它。

你不會說“這是一個晶體管產品”,只會覺得“OK,這東西可以爲我處理信息”。

你甚至會理所當然地忽視晶體管的存在。

Q1:如果你現在20歲出頭,使用我們今天的基礎設施,你會選擇做什麼?

A:某個AI支持的垂直領域,我會選擇AI助教,或者我能想象到的最好的AI律師、AI醫療顧問,任何類似的東西。

Q2:如果你要寫一本書,你會給它取什麼名字?

A:我還沒有準備好標題,除了部分我想寫的東西,我還沒有完整構想過這本書。

不過我認爲它會與人類潛力有關。

Q3:在AI領域,有什麼是沒受到足夠關注,但每個人都應該花更多時間在上面的?

A:某種能夠理解你整個生活的AI,我希望看到有很多不同的方法可以解決這個問題。

並不一定需要真的有無限的上下文,但以某種方式,你可以擁有一個知道關於你的所有事情、可以訪問你的所有數據的AI Agent。

Q4:上個月有什麼事情讓你感到驚訝,Sam?

A:一個我不能談論的研究成果,但它好得令人震驚。

Q5:你最尊敬哪位競爭對手?爲什麼是他們?

A:我想說,我尊敬目前這個領域的每個人。

我認爲整個領域充滿了才華橫溢、非常努力的人。

我不是在迴避問題,我可以指出每個地方都有超級有才華的人,做着超級出色的工作。

Q6:告訴我,你最喜歡的OpenAI API是什麼?

A:我認爲新的實時API非常棒,我們現在有一個龐大的API 業務,裡面有很多好東西。

Q7:你今天最尊敬AI領域的誰?

A:讓我向Cursor團隊致敬。

有很多人在AI方面做着令人難以置信的工作,但在使用AI、讓AI提供真正神奇的體驗、創造大量價值的方面,Cursor以人們之前沒有想到的方式將這些部分拼湊在一起,我認爲這是非常了不起的。

這個答案排除了OpenAI裡的人,不然我得說出一長串名字。

Q8:你如何看待延遲和準確性之間的權衡?

A:需要一個在延遲和準確性之間的刻度標準。我們正在做快問快答,我沒有特意加快速度,但也儘量不想太久。

在這種情況下,你想要的是(降低)延遲。如果換成想在物理學上做出新的重要發現,就願意多等待幾年。

答案是,應該由用戶控制這個權衡。

Q9:我相信每個人都會對自己的領導力感到不安,這種情況下,以及您希望改進自己的領導力領域時,作爲OpenAI的領導者、CEO,您最希望改進哪些方面?

A:這是一個很長的清單……我試圖釐清排名第一的是哪一個。

這周最困擾我的事情是,我對我們產品策略的細節比過去還要不確定。

我認爲該產品總體上是我的弱點,現在公司需要我在這方面有更強大、更清晰的願景。

我們有一位出色的產品主管和一支出色的產品團隊,但我希望在這個領域我能更強大。

Q10:你僱用了Kevin Weil(來擔任CPO),我認識Kevin很多年了,他非常出色。是什麼讓你覺得Kevin是世界級的產品領導者?

A:“紀律”是我想到的第一個詞。

我們將專注於我們要說“不”的事情,真正試圖代表用戶說爲什麼我們要做或不做某件事,真正努力不抱有幻想。

Q11:Sam,你接受了很多采訪。

最後我想談一談,我們對OpenAI有五年的展望和十年的展望。

A:如果我們是對的,我們可以輕鬆地在接下來兩年內開始製造系統,幫助科學進步。

五年後,OpenAI的技術進步速度會快到令人難以置信,完全可以用瘋狂來描述。

第二點是,社會本身的變化實際上很小。

就像五年前問大家計算機是否會通過圖靈測試,大家都會搖頭。

如果你說一個神諭告訴你會怎麼怎麼樣,他們會說:oh,這將會是一個瘋狂的、驚人的社會變化。

而現在,我們確實通過了圖靈測試,而且社會並沒有發生太大的變化。

一切只是呼嘯而過。

我期望不斷髮生的事情就是進步,科學進步,不斷前進,以一種我認爲良好和健康的方式超越所有期望,同時社會變化並沒有那麼大。

(完)

參考鏈接:https://www.youtube.com/watch?v=peg-aX1oii4