親歷者揭秘 OpenAI 崛起的關鍵:興趣驅動的探索,而非目標導向的馬拉松

沿着 Scaling Law、卷模型性能,可能會走到「死衚衕」。

「底稿」對話欄目

誰在影響、定義我們的時代?他們做了什麼,如何思考?對話關鍵人物,記錄歷史底稿。

本欄目將持續推出。

文 | 黎詩韻編輯| 鄭玄

我們被倡導要想明白自己的目標是什麼、並做出計劃。然而,兩位人工智能研究者卻認爲,這隻適用於普通的小願望。

一旦涉及過於高遠的、不確定能否實現的目標,比如打造 AGI(通用人工智能)、登月計劃等等——那麼根據興趣進行自由的、開放性的探索,才更能實現想要的。他們把這一觀點寫成了《爲什麼偉大不能被計劃》一書。

在這本書出版的 2015 年,OpenAI 成立,它一開始就確定了實現 AGI 的目標。九年間,OpenAI 取得的巨大成功,似乎證明了人工智能界是一場「目標導向者」的勝利。「OpenAI 看似是目標導向的,但實際上在內部,它有很多有趣的、開放性的探索。」本書作者之一肯尼斯·斯坦利 (Kenneth Stanley) 告訴極客公園。

2015 年,他任美國中佛羅里達大學計算機科學系助理教授,和前博士生喬爾·雷曼(Joel Lehman)一起合著了該書。第二年,他們進入產業界,加入 Uber AI 團隊。2020 年,他們又一起加入了 OpenAI,肯尼斯擔任 OpenAI「開放性研究團隊」負責人。

OpenAI的CEOSam Altman 是他們這本書的推崇者。他曾在一個公開場合提到,OpenAI 訓練模型時會設定指標,指標的上升讓人開心,「但對於找出一個新的研究範式,就不起作用了」。受書中觀點啓發,他願意嘗試更多新奇性探索,「我們願意耐心等待數月、數年,大多數時候它(探索)並不起作用,但當它起作用的時候、效果驚人地好。」

加入內部,肯尼斯和喬爾看到開放性探索如何塑造了 OpenAI 的成功。例如 ChatGPT 本是一個意料之外的項目,它曾是內部幾大方向中最邊緣的;碰巧撞上了谷歌的 Transformer 架構;而 Dario Amodei(前 OpenAI 研發副總裁、現 Anthropic CEO)提出 Scaling Law(縮放定律)是爲了測試模型安全性、而非涌現智能等等。

隨着 2022 年底 GPT-3.5 發佈,全球人工智能行業開啓了激烈競賽。在二人看來,AGI 仍然是一個遙遠的、而非近在咫尺的目標,僅靠 Scaling Law 這個「踏腳石」還不夠。在這種情況下,開放性探索非常重要——而目前行業極具收斂的目標和計劃、以及激烈的競爭,反而可能讓研究走進「死衚衕」。

即便 OpenAI 也面臨挑戰,喬爾感覺到,一種緊張的氛圍開始在內部出現,開放性探索的空間也在縮窄。2022 年,他們離開了 OpenAI。隨着人工智能越來越強大,他們希望更多研究一些開放性命題,比如 AI 會如何影響人類和社會、如何從哲學角度看待 AI 等等。

目前,喬爾加入了一家研究虛擬生命的公司,而肯尼斯創辦了基於開放性系統的社交網絡 Maven、並獲得了 Sam Altman 的投資。他們都在開放性探索的路上繼續前進着。

以下爲極客公園與肯尼斯、喬爾的對話實錄,經整理後發佈:

《爲什麼偉大不能被計劃》一書的中英版 | 圖片來源:受訪者

01

OpenAI 看似是

「目標導向型」的成功,

實則是「開放性探索」的成功

極客公園:先從這本書的起源聊起,我很好奇你們十年前是怎麼想到提出「爲什麼偉大不能被計劃」這個觀點的?你們最早研究人工智能的「開放性系統」,做了圖片孵化器、機器人迷宮等實驗,好奇哪些事實讓你們覺得這個觀點是成立的、並且可以應用到除了人工智能以外的其他領域?

Kenneth:最初的想法來自於人工智能領域的研究,也就是我們所說的「開放性系統」(Open-Endedness)。這種系統早已存在,比如生物的演進,在幾十億年中,從單細胞進化爲各種各樣的動物。又比如簡單的發明創造,我們可能花了數千年,才創造了一個輪胎、空間站和計算機等等。

作爲歷史學家和計算機科學家,我們希望用算法打造一個「開放性系統」,想了解它的工作原理,怎麼不斷創新、產生非常有趣的東西。所以我們做了「圖片孵化器」網站。這個 AI 系統沒有任何目標,人們隨機在上面將不同圖片進行「繁殖」,這些圖片會構成類似生物學「分支樹」的關係。

雖然每個用戶都是從亂塗亂畫開始的,但漸漸我們看到了一些熟悉的、可辨認的圖片,比如蝴蝶、頭顱、行星、汽車等等。我們進而得出一些有意思的洞察,比如你孵化出了一張酷似車的圖片,但你最初並不是以此爲目標的。而如果你以此爲目標,你根本得不出這張照片。這是矛盾之處。遵循這樣的原則,我們提出了基於新奇性探索、而非目標驅動的搜索算法。

最後我們發現,這不僅適用於算法領域,也適用於個人和機構。每一個個人和機構都會設定目標,但這種目標驅動並不總是對我們的創造和發明奏效。Joel 和我覺得這個過程非常重要,值得公開說出來。我們試圖找到相關信息、並進行多次對話,這就是我們這本書想法的來源。

極客公園:可否理解爲這本書的核心觀點是,無論在算法、個人還是組織層面,面對一個更遙遠的目標,制定計劃不如自由探索有效?

Joel:一般來說,普通的做法是我們樹立一個目標、制定計劃。但我們是不制定目標、只是去探索新奇的東西。比如迷宮裡的機器人,如果給它制定走出迷宮的目標,那它可能很難走出這個死衚衕。但如果不告訴它去哪裡、而是讓它自由探索,它會更容易走出迷宮。

肯尼斯和喬爾做的「圖片孵化器」網站,從亂塗亂畫中出現了一些熟悉的、可辨認的圖片 | 圖片來源:受訪者

極客公園:我注意到,在你們剛出完這本書不久的 2015 年,OpenAI成立了。這家公司從創立起就確定了一個非常偉大的目標,那就是實現 AGI,它的每個步驟都是圍繞這個目標進行。今天我們看到,OpenAI 似乎取得了成功。所以我想問,在你們這本書出版後的十年裡,OpenAI 的故事是否反而證明了「目的驅動模式」的成功?

Kenneth:非常好的問題。我認爲非常重要的一點就是要注意到,OpenAI 雖然取得了一定的進展,但還沒有取得 AGI 的成功。另外,我們也要意識到,公司往往會向公衆講述目標,但這其實是它們一種敘述的手段,這並不意味着企業內部就是這麼推動工作的。

如果你去看OpenAI的幕後,你會發現它們不僅僅是目標導向的,它們也有很多有趣的、開放性的探索。實際上,ChatGPT 就是這樣一種開放性探索,它是在一個意料之外的項目。我並不認爲 OpenAI 的工作人員最早就設立了要做 ChatGPT 這個項目(的目標),或者說預見到了它能取得如此巨大的成功。它們只是在探索過程中發現這個項目非常有意思,然後一步步更新迭代纔有了今天的 ChatGPT。

我們書中也提到過,創新究竟該如何推進呢?其實就是我們從有趣的一些想法開始,那究竟它是否會將我們引導向最終 AGI 的成功呢?其實這並不一定,但這是非常重要的一步,它們最終都有可能帶來革命性的變化。

另外,它也能實現其他一些重要的成就,比如吸引更多的投資。我們知道 GPT-2 並沒有帶來巨大的革命性變化,但我們仍然要儘可能地宣傳,才能吸引更多投資來發展 GPT-3、GPT-4,並最終向 AGI 的目標前進。OpenAI 就是這麼做的,這正體現了我們書中的觀點。

Joel:OpenAI 看上去是一個目標導向型的成功,但其實 OpenAI 剛成立的時候,內部有嘗試很多不同的發展方向。比如當時他們非常看重強化學習,包括視頻、遊戲的強化學習,爲此內部做了很多嘗試。

而且 GPT 背後的核心技術是 Transformer 架構,這是由谷歌推出的,所以 OpenAI 也是在谷歌這樣的巨人的肩膀上不斷髮展的。如果回顧 10 年前、20 年前、30 年前、40 年前,沒有這麼多「踏腳石」的情況下,OpenAI 也不可能取得這樣的成功。

極客公園:你們定義了OpenAI看似是目標導向、但其實是自由探索式的成功。OpenAI 內部人士曾跟我們說,鋪墊 GPT 3.5 的幾個「踏腳石」都是隨機碰撞出來的,比如聊天機器人曾是內部最邊緣的項目、碰巧撞上了谷歌的 Transformer 架構、而 Dario 提出 Scaling Law 也不是爲了智能涌現而是想測試模型是否安全……這是否跟你們瞭解的情況接近?

Joel:是的,這些隨機探索的確是非常重要的。尤其是 OpenAI,它很早就開始推進 Scaling Law 等嘗試,並且不斷在做選擇,這是非常正確的。

Kenneth:的確探索很多時候是隨機的、根據興趣進行的。但 Dario 提出 Scaling Law,這不僅是一個隨機的探索、這其實也是一個目標導向性的做法。

這背後是團隊從自己的興趣出發、做了很多嘗試,想要找到解決方案,最終提出了 Scaling Law 這個解決方案。這某種意義上也是一種目標導向。

極客公園:所以開放探索和目標驅動並不是彼此對立的,而是可以統一和融合的?

Kenneth:的確兩者是可以並存的,能夠從一方轉向另一方。但是在我看來,這其實也是一個非常困難的問題。什麼時候該進行轉向?什麼時候是目標導向、什麼時候是興趣導向?這非常微妙,很難去找到最佳的轉變時機。

極客公園:你們能夠看到OpenAI的內核其實是一個「開放性探索」的組織,這是當初吸引你們加入 OpenAI 的重要原因嗎?

Joel:哈哈,有許多原因。一個最主要的當然因爲 OpenAI 是 AI 領域的前沿公司。另外,它的確一開始就是一家「開放性探索」的公司,雖然它們肯定有一些目標導向的元素存在。這與我的個人興趣也是相關的。所以確實很難拒絕這樣一份工作。

極客公園:那麼 Sam 有看過你們這本書嗎、他是否認同你們提出的「開放性探索」觀點?這是他招募你們進入OpenAI的原因嗎?

Kenneth:Sam 非常喜歡我們書中的想法,我相信他是在觀看了我關於這本書的演講時接觸到這些想法的。他曾在公衆場合提到,他受到了這本書的一些想法的影響。Sam 對這些想法是非常包容和開放的,我覺得他暴露在這些想法當中、他認爲這些想法非常有意思。

當然,我在 OpenAI 也不僅僅是因爲 Sam,內部很多人都有開放的想法。比如 Jeff Clune(前 OpenAI 研究團隊負責人),他在我們之前加入 OpenAI。他也覺得,開放性探索是一個有趣且值得投資的領域。我們在那個時候達成了共識,所以我們被僱傭了。

在我看來,這本書並不是 OpenAI 的工具書。但我相信,這一文化確實對他們有影響,開放性探索是非常重要的。

極客公園:Ken 當時是 OpenAI「開放性探索」團隊的負責人,當時 OpenAI 對你們的期待是怎樣的?有給你們制定了怎樣的目標嗎?

Kenneth:我們面臨的挑戰在於,幾乎任何一家公司都會感興趣設定目標。但如果我們探索的一些想法,並不完全是目標導向的、甚至會背離目標的話,我們肯定會面臨一些溝通上的挑戰。這有一些複雜,因此在日常的工作中,我們需要取得一個平衡。

有時候很難理解我們來自哪裡、僱傭我們幹嘛。他們可能會非常奇怪,覺得我們做的是非客觀性的一些東西。不過最終他們意識到,對於推動 AGI 來說,這些工作是非常有用的。這已經超出了傳統團隊的認識。

Joel:這裡面分爲兩部分:一個層面是關於組織的架構,很多人會困惑我們的工作,所以我們要跟他們解釋我們在做什麼,並找到我們工作跟 AGI 目標的關聯度;另一方面是我們實際工作的開放性,要創造新的東西。

就像 Ken 說的,我們需要在公司內部找到一種開放性的方法,既要讓大家瞭解我們在做什麼,也要新奇探索、取得進步,這兩者的平衡是一種微妙的舞蹈。

極客公園:你們是否感受到,在「開放性探索」上,OpenAI 這樣的初創公司可能比科技巨頭做得更好?我曾聽說,Google 雖發明了 Transformer 架構,但沒有率先做出 GPT,是因爲它的技術路線更目標導向——Google 更強調 Encoder(輸入),因爲它可以解決更多具體業務問題;而 OpenAI 更強調 Decoder(輸出),因爲它沒有那麼強的業務導向,更願意像無頭蒼蠅一樣做「開放性探索」,你們怎麼看?

Joel:我的理解是谷歌也有這種對話模型,也是很領先的。談到好奇、興趣、技術能力、率先應用於大衆等,我認爲其中包含了不同的變量。谷歌是一個更大的機構,可能有更多的「橡皮章」、繁文縟節這些東西,而 OpenAI 可能更開放。

Kenneth:我只是想說,涉及到任何一個大機構的成功,都包含了很多要素。不過我有一點我同意,OpenAI 確實在探索方面做得更好、它有更大的意願去冒險,而谷歌可能在這方面更加謹慎和猶豫,比如在公衆面前展示技術,谷歌可能會慢一步。

這可以理解。因爲谷歌作爲一個大公司,在發佈東西之前,需要做很多嘗試和實驗。他們更不願意失敗,它對於風險更有顧慮。但這並不一定是確定的,只是我們的看法。

我們看到,谷歌注重強化學習和各種方法,OpenAI 也注重強化學習、並在不同領域下注,最終它們都取得了成功。

極客公園:距離你們當時寫這本書已經過去快 10 年了,中間你們還加入了 OpenAI、Uber 等科技公司,經歷了這些再看這本書,你們覺得書中哪些觀點仍歷久彌新?哪些需要變化更新?

Kenneth:回頭望,這已經是我們這本書出版的第九年了。關於建立目標,我們有過非常多的、激進的爭論,但許多事情隨着時間的推移得到了驗證。

正如你剛纔提到的一些例子,有些人可能會認爲有些目標是有效的。但在過去十年的時間裡,我們越來越發現,目標導向有時會讓人感到困惑,會讓你有盲點、抓不到其他機會、看不到更多的可能。我們認爲十年後、甚至一百年後,這個觀點可能都不會過時。

在每一章中,我們都引入了一些歷史案例和引語,比如「行者無疆」——一個好的旅行者是沒有固定計劃的,他對於要到達哪裡並不太清楚——我不確定中國的哲學家老子是否在幾千年前提出了這種描述。這是一種哲學的觀點、一種經驗之談,並不是有很多科學證據,有時候聽上去是反直覺的、是一個離經叛道的東西。

社會中確實有一些問題,例如,整個社會的組織都在圍繞目標推動,並且把「目標是非常重要的」這種文化意識強加給我們。以教育爲例,老師根據考試內容教學、學生根據考試內容學習,這就是目標對教育的影響。在書中,我們強調了目標的影響是無處不在的,我們需要去掙扎往前走。

再次強調一下,我們認爲「偉大無法被計劃」這個觀點,是不會發生變化的。如果我們的人生只是目標導向的話,將無法取得完整的幸福。這也是爲什麼我們這本書如此成功和受歡迎的原因。

02

沿着 Scaling Law、卷模型性能,

可能會走到「死衚衕」

極客公園:雖然你們反對「目標導向」,但似乎目前全球人工智能界的目標都非常收斂且明確,一是追上 OpenAI 等公司、二是儘快實現 AGI,你們怎麼看這種現象?這種「目標至上」會是你們反對的嗎?

Kenneth:謝謝您的問題。我同意在目前的人工智能行業中,大家定了這兩個宏偉的目標,覺得「北極星」就在那兒、我們要朝着那兒走。不過回到我一開始說的,企業往往會對外有一套說辭,但它們內部可能並不是這樣做的。

我主要想談一談,我們到底離這樣的目標有多遠?如果說只差一個「踏腳石」、離得非常近,就像上世紀 60 年代制定登月計劃的時候、已經有很好的技術基礎,那麼我們可以通過制定目標去實現。

但問題在於,如果我們還需要很多個「墊腳石」、離目標還很遠,那設定目標可能會讓我們陷入困境、無法前進。歷史上有很多這樣的例子。比如在 2017 年,我們聽到有人說第二年就會有自動駕駛汽車上路,但其實不是這樣。

因此,單純採取目標導向的方法往往會無法實現目標,可能是因爲目標設定的時間太早、或者太過雄心勃勃。很多人認爲現在人工智能領域只差一個「踏腳石」,只需要擴大規模就可以了,這其實是過於簡單化了這個問題。但在我看來,真正核心的「踏腳石」還沒有被發現、我們並不僅僅差一個「踏腳石」。我們很可能正在陷入目標的陷阱和迷思之中。

Joel:的確我們現在處於一個「荒誕」的歷史階段,全球的科技公司都在追求 AGI,這種過於聚焦的目標是人類「革命性的時刻」。但我們要知道,AGI 的發展還要很長的時間。

現在許多人認爲,只需要擴大規模、參數,有更多的數據和算力,就可以可發展人工智能。這對我來說有些無聊,或者說有些無趣。這並不是最核心的「踏腳石」,我相信還有其他的路徑和方法需要我們去探索。

極客公園:爲什麼我們離 AGI 不只是「一步之遙」、不只差一個「踏腳石」?你們做出這個判斷的依據是什麼?

Joel:我們到底距離 AGI 有多遠,其實大家是有認知偏差的。就像自動駕駛一樣,並不太清楚到底需要多少個「踏腳石」。我們唯一確信的是,如果有一步之遙的東西,你必須要在那裡、你必須去做、必須去放大。

Kenneth:最近有一個類比,GPT-3 就像是一個孩子,GPT-4 像是高中生。但實際上,ChatGPT 更像是教科書中的知識,在某些方面,它可能超越了我們,而在其他方面,它可能不如我們。奇特之處在於,我們會感到某些東西非常接近了,但這不一定是 AGI。

但我們也不清楚究竟還要等待多久。我們甚至可能需要一位「愛因斯坦」的出現,才能達到下一個臺階。

極客公園:這讓我想到你們在書裡提到,其實從單細胞到人類的進化過程中,重要的「踏腳石」不只是智力,還包括對稱性等。那麼對於 AGI 來說,Scaling Law 帶來的智能提升會是一個靠譜的踏腳石嗎?它能支撐多久?

Kenneth:智能這個詞很容易讓人困惑,因爲它涉及許多方面。Scaling Law 遵循一些普遍的原理,但它也會喪失一些東西。比如在技術上,你必須將大量人類數據進行更好的壓縮和訓練,它不再是傳統意義上的智能、而是不斷提升的智能。我們最終可能會遇到一個瓶頸或死衚衕、會在訓練上遇到走不下去的時刻。

就像 OpenAI 在不斷擴大規模、增加參數,但它還是遇到了瓶頸(注:比如 GPT-5 處於難產狀態)。這也是爲什麼我們需要新的踏腳石。

Joel:如果想要達到 AGI 那模糊的彼岸,有點像做一個賭注,很多明顯的路徑都必須要去嘗試。因爲 AGI 可能不僅來自 AI,還可能來自數學、哲學和其他領域。

《神經語⾔模型的縮放定律》論文寫道,隨着模型⼤⼩、數據集⼤⼩和⽤於訓練的計算量的增加,語⾔建模性能平穩提升 | 圖片來源:OpenAI

極客公園:現在各大人工智能公司都在這一維度激烈競逐,而你們在書裡提到,競爭其實跟「開放性探索」相悖、因爲它是極其收斂的目標。你們怎麼看待現在人工智能領域的激烈競爭?

Kenneth:這就是目標導向的悖論,它會使得我們更加盲目,對其他方法和路徑視而不見。像 OpenAI、Anthropic 和 Google 這樣的公司,它們存在激烈競爭,因爲哪家如果落後了,就可能無法獲得更多資金,公司會受到生存威脅。

在這種競爭中,大家唯一的目標就是活下來。公司更傾向於繼續沿着既定路徑前進、擴大規模。如果這時候嘗試創新,會面臨失敗的風險、可能會被踢出局。所以創新往往會減少。我認爲在這樣的競爭環境下,很容易進入死衚衕。

不過當這些企業遇到瓶頸時,他們可能會意識到需要轉向、進行更多開放性探索。

極客公園:這跟很多人的看法相反,一般我們認爲激烈競爭會推動模型智能水平的提升、加速 AGI 的實現,但在你們看來反而會適得其反?激烈競爭會弊大於利嗎?

Kenneth:是的,這可能有些反直覺。雖然競爭會引發「軍備競賽」,使得模型性能有所提升,但過度的競爭會減少開放性的嘗試,使得創新更加聚焦和侷限、無法取得真正的進展。

極客公園:說了這麼久的「開放性探索」,那麼對於現在目標和路徑已經相對明確的人工智能企業來說,它們應該怎樣才能做好這件事?你們對於「開放性探索」有沒有一些建議?

Kenneth:我們會發現,很多公司太早就建立了一套體系,並且非常目標導向。如果一些探索在測試中表現不佳,他們就會放棄研究。我認爲這會減少開放性探索的機會,是非常不利的。

對於 AGI 也是如此。當前的 Transformer 架構可能還遠遠不夠,甚至我們對神經網絡的運作機制還了解得不夠,目前仍有許多失敗的案例。我們並不清楚究竟還差多少步才能實現 AGI,因此我們需要多重的、開放性的探索。

在當前階段,對於 OpenAI 和其他公司來說,它們不僅需要改善現有的模型、更需要探索新的路徑,這兩件事需要同步推進。

03

離開 OpenAI,人工智能界

還需要更多「開放性探索」

極客公園:不久前 Ken 接受了一個採訪,提到你離開 OpenAI 是因爲「有一些的沮喪、有一些頓悟」,我好奇你的「沮喪」、「頓悟」是什麼?方便跟我們分享一下嗎?

Kenneth:讓我想一想,我並不是說我對 OpenAI 不滿意,而是我越來越意識到,我對人工智能的影響存在一些擔憂。現在有很多關於人工智能消極影響、安全以及文明終結的討論,這都是很明顯的一些問題。

我越來越感覺到,社會中存在一些對人工智能的不滿情緒、人們感到越來越多的失落,大家會追問生命的意義究竟是什麼?比如,未來機器人可能有數百萬個非常好的想法,一秒之間就可以超越我們一生的成就、或者比我們個人多年的經驗更具智慧,那麼我們如何再去做有創意性的工作、並從中獲得成就感呢?這是一個非常嚴重的問題。

我感覺我的工作,似乎在某種程度上加劇了人們的這種擔憂和焦慮。因此,我想思考人工智能未來的發展方向、解決它深層次的問題——我們究竟該如何改善人工智能,使其更好地爲人類服務,促進人類之間的連接,而不是加劇競爭?

這是我最近非常關注的問題,我認爲需要進行開放性探索,我相信這對人類社會會更有助益。基於這樣的原則,我成立了一家自己的公司,希望建立一種開放性的社交網絡。

極客公園:你創立了 Maven,它是一款基於開放性探索的社交產品,可不可以介紹下 Maven 是一個怎樣的產品?爲什麼它能解決你提到的人工智能存在的問題?

Kenneth:你可能也注意到一些社交媒體存在的問題,比如信息繭房、對立觀點、不斷爭論的意識形態導向、甚至陰謀論等。那麼這些問題從何而來呢?實際上,這是因爲這些系統的質量有問題。

幾十年前人們就曾說過,人們會產生各種各樣的觀點和內容,但很多內容是負面的或不好的。而現在的社交媒體過於關注內容的受歡迎程度。我們認爲這種信息分發模式需要改進。

所以我創立了 Maven,這是一個基於內容質量來推薦的「開放性系統」。人們打分、評價,去找到好的內容。這種客觀的評價方式、而不是靠點贊排序,才能帶來更好的內容。

極客公園:我注意到 Twitter 的聯合創始人投資了你、Sam 也投資了你,爲什麼 Sam 會決定投資你?他對你這次創業有沒有提出建議?

Kenneth:Sam 的確投資了我的公司。我寫完這本書之後,也想讓「開放性系統」被更多人使用,於是萌生了成立自己公司的想法。從職業發展的角度,Sam 給了我許多建議和見解。

從孵化投資人到 OpenAI 的 CEO,Sam 自己的職業發展就是非常了不起的跨越。他給我的建議是,我們不一定要沿着一份工作、一條道路前進,我們的職業發展也可以非常多元化。這給我很大的啓發。

極客公園:Joel 離開 OpenAI 的原因是什麼呢?

Joel:主要是我的職業發展追求跟它不再完全契合。最初加入 OpenAI 時,這家公司還處於比較基礎的階段,內部有機器人、人工智能等多個研究方向。然而,後來這家公司變得更加聚焦,我也注意到公司內部存在一些緊張的氛圍,這對開放性探索有一定限制。

正如 Ken 提到的,我們需要考慮到 AI 對社會的影響、一些哲學問題、還有如何利用人工智能讓個人更好發展等等,這些都是很有趣的研究角度。我希望能繼續研究,而 OpenAI 可能並不是發展這些興趣的最佳場所。

離開 OpenAI 後,我加入了一家研究虛擬生命(artificial life)的初創公司,現在還在繼續從事開放性系統的研究。

肯尼斯加入 OpenAI 時發佈的推文 | 圖片來源:X

極客公園:你們提到,即使是 OpenAI 這樣最頂尖的人工智能公司,隨着公司規模的擴大,它在開放性探索上的投入也開始變得緊張。你們對此有什麼擔憂嗎?

Kenneth:的確如此,資金的壓力還是非常明顯的,如果沒有明確的回報,管理層可能會減少開放性探索的投入。不過對於一些創新型的初創企業來說,應該還好。

像 llya(注:OpenAI 前首席科學家)剛剛離開了 OpenAI,成立了自己的公司。他說他唯一的目標就是實現 AGI,而且投資不是大問題。這表明即使沒有明確的回報,也能得到資金支持,許多研究人員都在進行各式各樣有趣的探索。

關於 OpenAI,有人說它現在變得更加商業化,我不太確定。不過內部肯定還有一些開放性探索的機會。因爲商業化並不是 OpenAI 的最終目標,也不是很多 OpenAI 研究人員的唯一目標。

極客公園:Sam 有跟你們聊過這方面的困惑嗎?比如隨着公司規模變大,他是否感到開放性探索更難做了?

Kenneth:這是一個非常有趣的問題。我不太清楚 Sam 的腦袋裡在想什麼,因爲他沒有跟我聊過這些。

極客公園:最終回到個人,你們是人工智能研究員和創業者、也是普通人。如果你們自己有一個看起來很遠大的、又很不確定的目標,你們會怎麼實現它?你們對普通人有什麼建議嗎?

Joel:作爲一個研究者,有些東西可能是似是而非的。我們書中的一些想法並不一定直接帶來成功,有時需要我們慎重認真的看待和廣泛閱讀。

作爲個人,我認爲保持謙卑、開放探索的心態非常重要。因爲偉大是不能被計劃的,但我們可以找到偉大中的亮色。

Kenneth:作爲個人,你要保持均衡。比如當你過於專注於目標,生活可能就沒有那麼有趣。就像有人的目標是賺錢,但如果發現了其他有趣的機會,即使這個機會的收入並不高、也不在主流地帶,我也建議他嘗試。

作爲研究者,事實上,我想都沒想過什麼東西會導致 AGI。我相信直覺。也就是說,我會遵循我的興趣行動,而這會引導我發現更多的有意思的東西。看起來我離目標更遠了,但實際上,興趣纔會通往最終目標的實現。

*頭圖來源:受訪者

本文爲極客公園原創文章,轉載請聯繫極客君微信 geekparkGO

極客一問

開放性探索如何才能

在普遍追求短期成就的大環境中得以延續?

扎克伯格:相比開源的風險,更擔心 AI 被集體掌控。

點贊關注極客公園視頻號,