獨家專訪諾獎得主哈薩比斯:我們將看到一種全新的科學復興

注:本文系舊文重發,首發於2022年02月17日。

近日,《麻省理工科技評論》獨家專訪了 DeepMind 的 CEO 兼聯合創始人戴密斯·哈薩比斯(Demis Hassabis),從他的學生時代聊到創業歷程,亦從 AlphaGo 聊到了 AlphaFold。

圖 | 戴密斯·哈薩比斯(Demis Hassabis)(來源:《麻省理工科技

儘管 AlphaFold 在 2021 年名聲大噪,但很明顯這是哈薩比斯的起點,而不是終點。他對《麻省理工科技評論》說:“我們將看到一種全新的科學復興,這些 AI 技術將繼續變得更加複雜,並被應用到廣泛的科學領域。隨着 AI 浪潮的興起,更多的問題將變得可以處理。”

(來源:《麻省理工科技評論》)

如他所言,2 月 16 日,DeepMind “果真”公佈了 AI 用於核聚變的新成果。當天,該公司與瑞士等離子體中心(Swiss Plasma Center,SPC)宣佈,雙方訓練出一種深度強化學習算法,可用於核聚變研究中的等離子體磁控制。

相關論文以《通過深度強化學習對託卡馬克等離子體進行磁控制》(Magnetic control of tokamak plasmas through deep reinforcement learning)爲題發表在Nature上 [1]。

(來源:Nature)

據悉,氫原子在極高溫下產生一個旋轉、攪動的等離子體,託卡馬克使用強大的磁場將等離子體限制在數億攝氏度溫度下,甚至要高於太陽核心溫度,從而進行核聚變發生研究。

值得一提的是,SPC 的託卡馬克較爲特殊,它允許各種等離子體配置,因此得名可變配置託卡馬克(variable-configuration tokamak,TCV)。

圖 | 包含等離子體的 TCV 3D 模型,周圍是各種磁線圈(來源:Dee

託卡馬克通過一系列磁線圈形成並保持等離子體,這些線圈的設置,特別是電壓,必須仔細控制。否則,等離子體可能與管壁碰撞並惡化。爲了防止這種情況發生,SPC 的研究人員首先在模擬器上測試他們的控制系統配置,然後再實際應用到 TCV 上。

“我們的模擬器基於 20 多年的研究,並不斷更新,”SPC 科學家兼該研究的合著者費德里科·費利奇(Federico Felici)說,“但即便如此,仍然需要長時間的計算來確定控制系統中每個變量的正確值。”

核聚變研究突破的一個關鍵就是發現控制等離子體的智能方法。這給了 DeepMind 大展身手的空間。DeepMind 的專家開發了一種 AI 算法,在模擬中嘗試許多不同的控制策略。

根據收集到的經驗,該算法生成了一種控制策略,以產生所需的等離子體配置。等離子體的配置與其在設備中的形狀和位置有關。這意味着科學家可以用它來研究限制和控制等離子體的新方法。

據介紹,DeepMind 首先使用該算法運行許多不同的設置,並分析每個設置產生的等離子體配置。然後,該算法被要求以另一種方式工作 - 通過識別正確的設置來產生特定的等離子體配置。

經過訓練後,基於 AI 的系統能夠創建和維護各種等離子體形狀和高級配置,包括同時在容器中維護兩個獨立等離子體的配置。並在 SPC 的模擬器上進行訓練。

最後,研究小組直接在託卡馬克上測試了他們的新系統,以下爲系統在現實世界條件下的表現。

動圖 | 使用強化學習控制器生成的各種不同等離子體形狀(來源:D

SPC 主任安布羅焦·法索利(Ambrogio Fasoli)說,這代表了“重要的一步”,可能會影響未來託卡馬克的設計,甚至加快通往可行聚變反應堆的道路。

“從我的感受看,託卡馬克模擬器很重要,一般的託卡馬克實驗參數都是有運行人員根據歷史數據和經驗給出的,很有可能因爲各種原因侷限在一些小的局域最優化參數上,用託卡馬克模擬器+強化學習,確實有可能探索到一般人類不曾想到或者不敢嘗試的參數空間,這對於挖掘現有聚變裝置的潛力很有意義。”國內一位專家表示。

DeepMind 的成就雖然意義重大,但只是邁向可行的聚變能源的一步。託卡馬克的狀況每天都在變化,需要在物理和模擬中進行算法改進。關於核聚變能何時準備好商業化也存在不確定性。估計從 20 年到 30 年不等,這還不包括擴大規模。這可能是一個長達數十年的後續過程。

儘管如此,DeepMind 斷言,人工智能可以幫助加速聚變能的上市之路。DeepMind 的喬納斯·布赫利(Jonas Buchli)在簡報中說:“我們相信人工智能是人類創造力的倍增器,開啓了新的探究領域,使我們能夠充分發揮潛力。人工智能系統正變得足夠強大,可以應用於許多現實世界的問題,包括科學發現本身。”

這一切或許可以從 2016 年 3 月談起,在韓國首爾,DeepMind 的 CEO 兼聯合創始人戴密斯·哈薩比斯(Demis Hassabis)見證了該公司的 AI 技術所創造的歷史。

許多人認爲圍棋是世界上最複雜的棋盤遊戲,需要幾年的時間才能掌握。然而,AlphaGo,一個受訓練後掌握古老棋盤遊戲圍棋的計算機程序,與當時圍棋界世界排名第二的韓國頂級職業選手李世石進行了五場比賽。

李世石賽前預測他將以“壓倒性的優勢”擊敗 DeepMind 的 AI。然而,AlphaGo 最終以 4-1 獲勝,它的勝利同時震驚了圍棋界和 AI 專家,改變了世界對 AI 能力的看法。

不過,當 DeepMind 團隊在慶祝獲勝時,哈薩比斯已經在考慮一個更大的挑戰。他記得當時他與牽頭開發 AlphaGo 的大衛·西爾弗(David Silver)站在慶祝現場的後臺:“我對他說,‘現在是時候了。’”

預測蛋白質的結構:半個世紀的未解難題

看着 DeepMind 的 AI 下圍棋,哈薩比斯意識到該公司的技術已經準備好應對生物學中最重要和最複雜的難題之一:預測蛋白質的結構,這是一個 50 年來科研人員一直試圖解決的難題。

蛋白質的三維(3D)結構決定了它們在體內的行爲和相互作用,然而大量重要的蛋白質仍然具有生物學家不知道的結構。蛋白質是許多藥物的主要靶點,也是新療法的關鍵成分,快速解鎖它們的結構將加快新療法和疫苗的開發。如能使用 AI 準確地預測它們,將爲人們瞭解癌症和新冠肺炎等疾病提供寶貴的工具。

2020 年,Alphabet 旗下的 DeepMind 發佈了 AlphaFold2,這是一種能將蛋白質的形狀預測到接近原子尺度的 AI 工具。哈薩比斯說:“這是我們做過的最複雜的事情。”

(來源:DeepMind 官網)

AlphaFold 的成功亦是一個更宏偉故事的一部分,其標誌着 DeepMind 的發展方向已然發生改變。該公司的工作重點從遊戲轉向科學,以期對現實世界產生更大影響。解決科學問題是哈薩比斯想要實現的目標,他也希望藉此“一朝成名天下知”。他說:“這就是我創立 DeepMind 的原因。事實上,這就是爲什麼我的整個職業生涯都在 AI 領域。”

25 年來,哈薩比斯一直在斷斷續續地“思考”蛋白質。20 世紀 90 年代,當他還是劍橋大學的一名本科生時,他就接觸到了這個問題。哈薩比斯說:“我的一個朋友對這個問題很着迷,他會抓住任何機會(在酒吧裡或者打檯球的時候)跟我說,如果我們能破解蛋白質摺疊,這將是生物學的變革。他的激情始終讓我不能釋懷。”

這位朋友叫蒂姆·史蒂文斯(Tim Stevens),現在是一名研究人員,在劍橋大學從事蛋白質結構研究工作。史蒂文斯說:“蛋白質是使地球生命正常工作的分子機器”

(來源:《麻省理工科技評論》)

幾乎我們身體做的所有事情都會用到蛋白質:它們消化食物、收縮肌肉、激發神經元、探測光線以及增強免疫反應等等。因此,理解單個蛋白質的作用,對於理解身體是如何工作的、當它們不工作時會發生什麼、以及如何修復它們至關重要。

蛋白質由一串氨基酸組成,這些氨基酸通過化學力摺疊成一個複雜的既扭曲、又旋轉的結,所生成的 3D 形狀決定了它的作用。

例如,血紅蛋白是一種在體內運送氧氣並使血液呈紅色的蛋白質,它的形狀像一個小袋子,這讓它能捕獲肺部的氧氣分子。而 SARS-CoV-2 病毒的刺突蛋白結構,使其能附着在細胞上。

問題在於,很難從一串氨基酸中找出蛋白質的結構以及功能,一條展開的氨基酸串有 10^30000 種可能的形式,這是與圍棋遊戲中所有可能走法的規模相當。

在實驗室中,使用 X 射線晶體學等技術來預測蛋白質結構是一項艱苦的工作。無數博士都在研究單一蛋白質的摺疊。

CASP(Critical Assessment of Structure Prediction,結構預測關鍵評估)競賽成立於 1994 年,該競賽歷時已久,其旨在通過每兩年讓計算機化預測方法相互競爭來加快研究速度。然而,沒有任何一種技術能達到實驗室工作的準確性。到 2016 年,相關工作進展已經停滯了十年。

2016 年,AlphaGo 獲得成功後的幾個月內,DeepMind 僱傭了一些生物學家,併成立了一個小型跨學科團隊來解決蛋白質摺疊問題。他們研究的技術在 2018 年首次被人所知,當時 DeepMind 以顯著優勢擊敗了其他技術,贏得了 CASP 13 競賽的獎項。

然而在生物學世界之外,很少有人注意到。當 AlphaFold2 兩年後問世時,情況發生了變化。AlphaFold2 贏得了 CASP 競賽,標誌着在預測蛋白質結構上,AI 以和實驗室生產模型的精度誤差範圍,首次縮小到只有一個原子的寬度,生物學家對它的出色表現感到震驚。

哈薩比斯說,在首爾觀看 AlphaGo 比賽時,他想起了一款名爲 FoldIt 的在線遊戲,這是一款華盛頓大學蛋白質研究人員大衛·貝克(David Baker)領導的團隊在 2008 年發佈的遊戲。FoldIt 要求玩家以不同的方式摺疊蛋白質結構,在屏幕上以 3D 圖像的形式呈現。遊戲背後的研究人員希望,隨着很多人加入該遊戲,一些關於某些蛋白質可能形狀的數據可能會出現。是的,它奏效了,FoldIt 玩家甚至爲一些新發現做出了貢獻。

二十多歲時,哈薩比斯在麻省理工學院做博士後時玩過這款遊戲,讓他感到震驚的是,人類的基本直覺可以帶來真正的突破,無論是在圍棋中走一步棋,還是在 FoldIt 中找到一種新的配置。

哈薩比斯說:“我在想我們實際上對 AlphaGo 做了什麼。我們模仿了令人難以置信的圍棋大師的直覺。我想,如果我們可以模擬圍棋中那種豁然開朗的感覺,那麼爲什麼我們不能將其帶入到蛋白質中呢?”

在某種程度上,這兩個問題並沒有太大不同。就像圍棋一樣,蛋白質摺疊是一個極其複雜的組合問題,這是暴力計算方法無法比擬的。圍棋和蛋白質摺疊的另一個共同之處是,可以獲得關於如何解決問題的大量數據。

其中,AlphaGo 使用了自己在過去積累的經驗;AlphaFold 使用了蛋白質數據庫中現有的蛋白質結構(蛋白質數據庫是一個國際數據庫,包含了生物學家幾十年來不斷增加的已解決的結構)。

另據悉,AlphaFold2 使用注意力網絡(Attention Networks),這是一種標準的深度學習技術,可以讓 AI 專注於輸入數據的特定部分。這項技術支撐着像 GPT-3 這樣的語言模型,它將神經網絡導向句子中的相關單詞。類似地,AlphaFold2 被導向序列中的相關氨基酸,例如在摺疊結構中可能在一起的氨基酸對。

史蒂文斯說:“他們把生物學家幾十年來一直在推動的所有東西結合在一起,然後在 AI 領域輕鬆擊敗了參與 CASP 的其他技術。”

(來源:DeepMind 官網)

AlphaFold 已被用於各類研究

過去一年裡,AlphaFold2 的影響力逐漸擴大。DeepMind 已經發布了該系統的詳細工作原理,併發布了源代碼。該公司還與歐洲生物信息學研究所(European Bioinformatics Institute)建立了一個公共數據庫,該數據庫正在填充 AI 預測的新的蛋白質結構,目前有大約 80 萬個條目,DeepMind 表示明年將增加超過 1 億個條目——幾乎是科學已知的所有蛋白質。

英國 AI 藥物研發公司 Exscientia 的首席科學家、牛津大學蛋白質信息學實驗室負責人夏洛特·迪恩(Charlotte Deane)表示,許多研究人員仍未完全理解 DeepMind 的成就。迪恩也是 DeepMind 去年在科學期刊Nature上發表 AlphaFold 的論文的審稿人之一,她說:“它改變了你可以問的問題。”

世界各地的一些團隊已經開始在抗生素耐藥性、癌症和新冠病毒等研究中使用 AlphaFold。費城福克斯蔡斯癌症中心的羅蘭·鄧布拉克(Roland Dunbrack)是早期使用者之一,其領導的團隊多年來一直在使用計算機預測蛋白質結構。

AlphaFold 爲鄧布拉克的工作帶來了前所未有的準確性,他說:“它們足夠精確,可以做出生物學判斷,解釋癌症基因的突變。我們之前一直嘗試用電腦生成模型,但經常出錯。”

鄧布拉克說,現在當同事們請他爲蛋白質建模時,他對他所提供的東西更有信心了。他說,“(不然)我真的很緊張,擔心他們會回來找我說,‘我們的錢都打水漂了,你的模型很糟糕——它沒有用。’”

鄧布拉克表示,AlphaFold 仍然會出錯。但當它運行良好時,很難區分它的預測和實驗室產生的結構之間的區別。他在一個名爲 ColabFold 的計算機平臺上運行 AlphaFold 預測,該平臺由哈佛大學支持並在 Google GPU 上運行。他說:“每天晚上睡覺前,我都會配置一個預測,運行它要花上幾個小時。”

(來源:DeepMind 官網)

即使是最好的 AI 也會出現愚蠢的錯誤

“這是一個非常有用的工具,我實驗室裡的每個人都在使用。”加州大學舊金山分校的結構生物學家克利門特·維巴(Kliment Verba)說。維巴主要研究癌症,但在 COVID-19 大流行的最初幾周,他加入了一個由研究 SARS-CoV-2 病毒的研究人員組成的鬆散聯盟,他想弄清楚 SARS-CoV-2 病毒的蛋白質是如何劫持宿主蛋白質的。

維巴和他的同事已經爲他們感興趣的病毒蛋白生成了部分結構,但仍然缺少一部分。許多蛋白質都擁有多個結構域。結構域是蛋白質中密集摺疊的單元,一般每個結構域有幾百個氨基酸長,而且每個結構域都有着自己單獨的功能。一個結構域可能與 DNA 結合,另一個結構域可能與另一個蛋白質結合,以此類推。鄧布拉克說:“它們就像是多頭野獸。”

從結構上講,域就像一根繩子上的結,由鬆散的、纏繞在一起的線連接起來。在維巴正在研究的蛋白質中,其團隊已經弄清楚了繩子的粗略形狀,但還沒有弄清楚所有繩結的詳細結構。沒有這些細節,他們就無法解釋它是如何工作的。

不過,他們意識到,這種蛋白質是 DeepMind 已經在 AlphaFold 上運行並在網上共享的蛋白質之一。AlphaFold 的預測並不完美,它捲起來的線不太對,但它具有蛋白質的四個結構域的形狀,研究人員利用 AlphaFold 對這些結構域預測,並根據它們的大致形狀將它們排列起來,這已經非常接近。

維巴說:“我清楚地記得我看到它的那一刻,這是驚人的。我們現在是世界上唯一擁有完整結構的公司。”他們很快發表了關於此次科學發現的相關出版物。

維巴認爲 AlphaFold 的優勢在於找到尚未被充分研究的蛋白質結構。他說:“許多我們關心的蛋白質已經被研究了幾十年,很多人將畢生精力投入其中,所以我們對它們的樣子有了相當好的瞭解。”但這仍然留下了許多未知領域。

例如,維巴對激酶很感興趣,激酶是一種在調節細胞正常功能中起着關鍵作用的酶。如果它們停止正常工作,可能會導致癌症。人體中大約 500 種激酶,只有大約一半被充分了解過,其餘的被稱爲黑暗激酶。

像維巴和鄧布拉克這樣的研究人員,對於開發針對激酶的抗癌藥物很感興趣,而這正是 AlphaFold 的侷限性所在。

因爲在實驗室中研究蛋白質的結構成本很高,通常只有在蛋白質被選爲有希望的候選者時纔會進行,而這可能需要幾個月的藥物發現過程。迪恩表示,AlphaFold 希望能夠扭轉這一局面,以便加速該過程。她說:“現在我可以從結構開始,確定它的表面哪裡有識別位點,以及哪裡是可以結合藥物分子的地方。”

然而,正如迪恩承認的那樣,要完全理解藥物和蛋白質之間的相互作用,不僅需要一個靜態結構。蛋白質不會靜止不動,它們的結構可通過微妙的重新配置進行循環。維巴說:“很多時候,這些小的轉變是生物功能的關鍵。”

更重要的是,一種蛋白質可能在一種狀態下接受藥物,而在其他狀態下則不接受。從研究人員目前所看到的情況來看,AlphaFold 似乎只預測了這些結構最常見的狀態,而這對於藥物開發來說可能並不重要。

當藥物與蛋白質結合時,蛋白質也會改變形狀,從而影響藥物的作用。在最壞的情況下,藥物與蛋白質的結合或對鄰近蛋白質產生不可預測的連鎖反應,甚至可能逆轉藥物的設計功能——例如激活而非抑制某些功能。

在阿斯利康,分子 AI 部門的負責人奧倫奎斯特(OlaEngkvist)認爲 AI 生成的結構最終將有助於識別藥物靶標——但現在還不是時候。他說:“爲了實現變革,AlphaFold 需要有更好的計算方法來理解蛋白質動力學,並處理更大的蛋白質複合物。”

DeepMind 計劃在下一個版本的程序中解決這些問題,其中一項工作是生成蛋白質形狀的多種變體,試圖捕捉其動態變化。蛋白質移動的方式是由複雜的化學原理和物理原理控制的,所以一個完整的移動模型可能需要向 AlphaFold 提供關於這一過程的大量額外信息。這種方法的缺點是,信息可能會變成一種約束,從而降低了工具的預測能力。

2021 年夏天,DeepMind 發佈了 AlphaFold Multitimer,旨在預測蛋白質複合物的結構,也就是由多種蛋白質聚集在一起的超結構。但它的準確性遠不如 AlphaFold,而且容易出現更明顯的錯誤。

即使是最好的 AI 也會出現愚蠢的錯誤,哈薩比斯表示,AlphaGo 在敗給李世石的一局中犯了一個基本錯誤。他說:“你可以認爲這是一個 bug。但問題是,這個 bug 存在於它的知識體系之中——你不能直接進入其中並調試它。”

這是因爲在不從根本上影響神經網絡工作的情況下,你無法輕易地修補神經網絡。哈薩比斯說:“硬編碼的修復會損害 AI 的學習能力,因爲它怎麼知道何時使用它們?這與學習的意義背道而馳。”

因而,DeepMind 正在收集 AlphaFold 最嚴重錯誤的例子,並訓練它正確處理這些錯誤。哈薩比斯希望研究人員破解 AlphaFold,找出不可行的地方,並與他的團隊分享結果,這樣他們就能讓下一個 AlphaFold 變得更好。

“AI for Science”:DeepMind 開啓新篇章

藉助 AlphaFold,DeepMind 開啓了新篇章。該公司正在投資一個名爲“AI for Science”的團隊,在過去的幾個月裡,它已經發表了一系列出版物,涉及從天氣預報到數學、量子化學和核聚變等領域。它們都沒有 AlphaFold 的影響力,但雄心的廣度是顯而易見的。哈薩比斯說:“我還沒有一個寫滿了想要解決的問題的手冊,但我心裡已經有雛形了。”

(來源:DeepMind 官網)

AlphaFold 也標誌着哈薩比斯的新篇章。2021 年 11 月,他宣佈獲得了一份新工作:他現在正兼任 DeepMind 的領導職務和初創公司 Isomorphic Labs 的 CEO。後者是 Alphabet 的一家新姊妹公司,將專注於將 AI 的力量帶入生物技術和醫學領域。

對於未來規劃,哈薩比斯並沒有詳述太多,他說:“我們纔剛剛開始,所以沒有太多可說的。基本上,我認爲還有很多東西像 AlphaFold 一樣——藥物研發途徑的不同方面都將適應 AI,”他補充道,“我的意思是,真正地去做(研發)——而不是徒有其表的小分析工具。”

在哈薩比斯官宣 Isomorphic Labs 的博客文章中,他寫道:正如數學被證明是物理學的正確描述語言一樣,AI 可能會在生物學中扮演類似的角色。

將這些工作融入到自己的創業中,可以更容易地投入所需的精力和資源。他說:“在 DeepMind 僱傭大量化學家是沒有意義的。”然而另一個事實是,儘管 DeepMind 迄今爲止一直專注於純研究(而不是爲母公司 Alphabet 的產品做貢獻),但是這家初創公司將主要尋找如何爲大型製藥公司帶來新事物。

哈薩比斯說:“你可以把它想象成有點像 DeepMind 對谷歌做的事情。我們的研究影響到了百種穀歌產品;你現在接觸的幾乎所有谷歌產品都有一些 DeepMind 技術。你可以將 Isomorphic Labs 視爲我們在谷歌之外的現實世界的出口。”

-End-

支持:李傳福、Ren

責編:多加、LXS

參考:

1.Degrave, J., Felici, F., Buchli, J. et al. Magnetic control of tokamak plasmas through deep reinforcement learning.Nature602, 414–419 (2022). https://doi.org/10.1038/s41586-021-04301-9