人生速通傳說:博士畢業後,7年就拿諾貝爾獎!

今天的諾貝爾化學獎授予了兩組研究者,其中大衛·貝克(David Baker)推動了蛋白質計算設計的發展,而戴密斯·哈薩比斯(Demis Hassabis)與約翰·朱默帕(John M. Jumper)則開發了AI蛋白質分析工具Alphafold。

也就是說,諾獎組委會竟然連續兩天把獎發給AI研究了!難道這一切都是AI的陰謀嗎……

你咋不叫諾貝爾AI獎呢 | Anjney Midha

哈薩比斯最新的X動態,是恭喜同樣搞AI的前同事得到物理獎,結果轉頭自己得了化學獎丨X/@demishassabis

不過,這個選擇其實並沒有那麼意外。Alphafold本身就是熱門候選,而與它一同被表彰的蛋白質設計工具也在生物化學領域起了非常重要的作用。這些工具極大地提高了科研效率,未來說不定還能改變我們的生活(點)

製造了這些好用工具的獲獎者,他們都是什麼來頭呢?

哈薩比斯:有點厲害的棋牌大師

哈薩比斯最爲人所知的成就,繞不開一個關鍵詞“圍棋”。

幾年前,AlphaGo打敗圍棋世界冠軍李世乭、柯潔的新聞還記得吧?開發AlphaGo的公司DeepMind,就是哈薩比斯一手創立的(現在被谷歌收購了)。

AlphaGo的老子哈薩比斯,和AlphaGo的對手柯潔丨the Seattle Times

但實際上,AlphaGo之父哈薩比斯的圍棋水平並不太高。他19歲纔開始學圍棋,現在的水平是業餘1段,只能算是“入了門”而已。

雖然開發出了下圍棋頂呱呱的人工智能,但製造者自己的圍棋水平有點普通丨bbc

不過,哈薩比斯的國際象棋水平很高:他4歲開始學國際象棋,13歲時成爲這個年齡組的世界第二。現在哈薩比斯在世界國際象棋聯合會的排名是全球第17009——畢竟大師如今也不靠國際象棋吃飯,排名低點是正常的,對吧?

1988年,12歲的哈薩比斯丨Marc Aspland

多說一句,哈薩比斯還在世界撲克大賽上拿過幾個名次。這個比賽裡包含了撲克的許多種玩法,不知道有沒有鬥地主和炸金花啊?

參加2014年世界撲克大賽的哈薩比斯,排名第11丨pokernews.com

玩遊戲不如做遊戲

《生活大爆炸》給了大家一個刻板印象:從事高科技行業的高智商男性,都很喜歡玩遊戲。哈薩比斯不僅玩,還做遊戲。

一個充滿象徵意義的擺拍,他旁邊是國際象棋,面前是非常古早的雅達利遊戲機丨ellines.com

哈薩比斯在老牌遊戲開發商牛蛙(Bullfrog)幹過一陣子。1993年,他在射擊遊戲《辛迪加(Syndicate)》系列中當遊戲測試員,也做一些關卡設計,算是進入遊戲行業的開山之作。

《辛迪加》的遊戲截圖丨mobygames/Melliuc

《主題公園(Theme Park) 》系列,很多人應該都玩過吧?玩家可以在一片空地上建立起好玩又賺錢的遊樂場。這系列遊戲的開山之作誕生於1994年,一經推出立刻爆火,銷量百萬、獲獎無數——遊戲項目負責人之一就是年僅17歲的哈薩比斯。

1994年版的《主題公園》,有遊戲考古癖的可以玩一下丨mobygames/B.L. Stryker

這兩款遊戲屬實有點久遠了,大家沒玩過都正常。但如果你小時候玩過《共和國:革命(Republic: The Revolution)》和《邪惡天才(Evil Genius)》,那真的得感謝一下哈薩比斯——他創立的公司開發了這兩款遊戲,也自己做了遊戲的執行設計師。

《邪惡天才》的截圖,似乎也是模擬經營類的遊戲,哈薩比斯真的很喜歡這個類型啊丨mobygames/Der.Archivar

降本增效楷模

還是說回哈薩比斯現在的工作吧。我們知道他開發的AlphaGo下圍棋贏了人類(沒啥直接經濟效益),AlphaFold能分析蛋白質結構(研究太基礎了),所以谷歌收購DeepMind到底賺到啥了?

谷歌抹淚:它真的好替我省錢。

2014年,谷歌收購了哈薩比斯創立的DeepMind,據說收購價高達數億美元,但DeepMind大概已經替谷歌把這筆錢賺回來了。

谷歌的電費大頭,並不是辦公室的照明和燒水,而是用在給數據中心降溫上。你手機運行個遊戲還會發熱呢,谷歌處理gmail、google search等的大型數據中心,發熱更厲害,必須降溫才能繼續用。而且隨着數據量爆炸式增長,降溫電費只會越來越高。

在被谷歌收購2年後,DeepMind就開發出了一個人工智能框架,經過挺複雜(且你們也不感興趣)(我也並不太懂)的過程,成功讓數據中心的降溫電費少了40%——據說能讓谷歌在未來好幾年裡,省下幾億美元。

賺了,真的賺大發了。

來自谷歌母公司首席財務官的微笑丨Eli Lilly

貝克:從哲學到生物學

大衛·貝克出生於1962年,現在是華盛頓大學蛋白設計所的主任。

大衛·貝克|Ian C. Haydon/IPD

他人生的大部分時間都在這所大學度過,小時候,他的父母都是這裡的教授——父親研究弦理論和夸克,母親研究天體物理和大氣科學。但貝克當時對科學並不感興趣,到哈佛大學念本科時,他選擇了哲學和社會科學,想知道人類大腦是如何做決定的。

直到大學最後一年,他上了發育生物學課程,讀到了《細胞分子生物學》這本書,纔開始對生物學感興趣。博士時期,他加入了加州大學伯克利分校的細胞生物學家蘭迪·謝克曼(Randy Schekman)的實驗室(蘭迪·謝克曼在2013年獲得了諾貝爾生理學或醫學獎),研究細胞是如何組織的。再之後,他的興趣逐漸轉移到了結構生物學上。

90年代末期,貝克實驗室開始開發計算機軟件Rosetta,這個軟件成功預測了氨基酸序列如何摺疊成最終的蛋白質構型。貝克隨後意識到,它可以反過來用——從蛋白質結構反向推出氨基酸序列,從而讓從頭設計蛋白質成爲可能。正是這個想法引領他獲得了諾貝爾化學獎。

每個人都能參與研究

貝克是徒步愛好者,他在一次徒步旅行中想到:可以讓公衆參與蛋白質摺疊的研究。

大衛·貝克維基頁面上的照片,看來真的很愛徒步|Jeffreyjgray

2005年,貝克實驗室開始運行志願分佈式計算項目Rosetta@Home。任何人只要在自己的電腦上完成配置後,電腦就會自動利用空閒計算力參與蛋白質結構預測的研究。2008年,他又與兩位計算機教授合作,開發了蛋白質摺疊遊戲Foldit,希望以此吸引公衆,幫助蛋白質結構研究推進。

在遊戲中,用戶使用工具,儘可能完美地摺疊蛋白質的結構。研究人員會對遊戲中的最高分方案進行分析,確定這些方案是否可以應用於現實世界,爲疾病、藥物開發等研究提供靈感。這並非癡人說夢,比如在2011年,Foldit玩家就幫助破譯了Mason-Pfizer猴病毒的逆轉錄病毒蛋白酶的晶體結構。

2019年,貝克在一次TED演講中描述了他對人造蛋白質的五個期待:用於流感、艾滋病和癌症的通用疫苗;治療慢性疼痛的先進藥物;能夠將已使用的藥物運送到特定細胞的蛋白質納米容器(這或許能消除副作用);治療神經退行性疾病;能用於太陽能捕獲的自組裝蛋白質。雖然不知道這些目標何時可以實現,但科學嘛,總能帶給人們突破不可能的希望。

貝克實驗室設計的一種基於蛋白質的納米容器(3D打印模型),其靈感來自病毒的幾何外殼|Ian C. Haydon/IPD

朱默帕:學物理和數學的化學獎得主

在還是青少年的時候,約翰·朱默帕(John Jumper)就自學了計算機編程,他在物理上也很有天賦,所以他本科讀了物理和數學。

朱默帕說,“我一直很喜歡發現宇宙真相,以爲我會成爲一個‘發現宇宙定律’的物理學家”。與此同時,他那對都是工程師的父母,在擔心這孩子以後永遠找不到工作。

本科時的Jumper

在本科階段,他就和費米加速器實驗室的人一起合作,研究被稱爲夸克的亞原子粒子的奇怪性質。有一天Jumper和研究人員一起吃午餐聊天,朱默帕問,“我們正在進行的這個實驗,什麼時候才能啓動呢?”其中一個教授說他可能會先退休,另一個更老的教授說他可能活不到那一天了。於是,朱默帕決定要去搞點速度更快、能在更短時間內完成的科學研究。

本科畢業後,他去了劍橋大學讀凝聚態物理的博士——但因爲不喜歡研究課題,他沒讀完就走了。然後朱默帕去了一傢俬人研究機構D.E.Shaw 研究公司,從事蛋白質的計算機模擬工作。

“我當年加入的時候都不知道蛋白質是啥。”朱默帕回憶說。但研究公司裡提供了很好的硬件環境,他可以用超級計算機來模擬分子,“我在一個週二做的模擬比我整個(劍橋)讀博期間做的還要多。”

然後朱默帕決定再讀一次博士,這次他去了芝加哥大學讀博,他仍然對蛋白質結構感興趣,而且開始轉向機器學習和神經網絡。他博士論文的標題是《基於嚴格機器學習的粗粒度蛋白質摺疊與動力學新方法》,在第一頁,他引用了英國統計學家喬治· 鮑克斯(George Box)的名言,“所有模型都是錯的,但有些模型是有用的。”

這句話也非常適合用來形容AI。

2017年Jumper拿到博士學位,博士畢業7年後就拿了諾貝爾化學獎。從諾貝爾化學獎經常不發給傳統化學家的角度來說,也非常合理。

要不是加入Deepmind,可能就不搞科研了

從芝加哥大學博士畢業的2017年,朱默帕加入了谷歌DeepMind團隊。

當時他已經聽說了Deepmind有計劃解決蛋白質結構預測的問題,不過那時這個項目還在保密階段。在去Deepmind面試時,他只要一提蛋白質摺疊,Deepmind團隊就轉移話題。

不過, 朱默帕對此很感興趣,也決意加入。“如果不是爲了 DeepMind,我可能會離開科學界。”

敢於轉向的Alphafold功臣

2018年,DeepMind團隊拿出了第一代AlphaFold,參加了第十三屆全球蛋白質結構預測比賽(CASP),這個比賽相當於蛋白結構預測界的奧林匹克,比的是預測的結構與實驗室裡實際確定的蛋白質實際結構有多接近。

當時他們還討論過要不要匿名參加,因爲如果是一個學術界的團隊參加而且慘敗了,也沒什麼,但是如果是谷歌這樣市值數十億美元的科技公司參與還失敗了,那就搞不好是個大新聞,而且股價也要波動了。不過,他們最後還是決定以谷歌 DeepMind 的名義實名參賽。

第一代AlphaFold表現得很好,但還沒有達到足夠高的準確率。當時,正是朱默帕決定拋棄原本的路線,重頭開始。同事回憶說,早期版本的“ AlphaFold2”表現比它的前輩差得多,但朱默帕堅持了下來,“他不害怕接受新的方向。”

僅僅2年後的2020年,朱默帕就帶着第二代AlphaFold參加了第十四屆全球蛋白質結構預測比賽(CASP14),預測了幾十種蛋白質的結構,誤差範圍僅爲1.6埃——這意味着預測精度已經達到了單個原子的級別,在研究中已經很實用了。

順便一提,2020年正值新冠大流行,所以CASP14這場比賽是在線上舉辦,通過zoom遠程召開的。在Alphafold2的比賽結果出來後,很多結構科學家們呆在自己家裡,盯着屏幕,意識到蛋白質科學的世界被永久改變了。

ZOOM會議中的AlphaFold團隊 | DeepMind

“人類在預測蛋白質結構方面是垃圾”

朱默帕認爲,在有些方面,AI比人類有明顯優勢。他說過,“我們人類在預測蛋白質結構方面是垃圾。”

AlphaFold並不會完全取代實驗方法。科學家們還需要用實驗來驗證AI的猜測,尤其是那些AI自己都拿不太準的區域。但它能夠將需要驗證的範圍大幅縮小,由此省下相當可觀的研究費用與時間。

朱默帕說,“我最自豪的是,AlphaFold2讓所有所有結構生物學的速度提高了5% 或10% ,生物學家現在可以節省一到兩年時間。”他們可以更快地去檢驗和確定某種蛋白質的結構。

已經有科學家用Alphafold2來繪製更好的人類心臟圖表,建立抗生素耐藥模型,鑑定澳大利亞5萬年前滅絕的鳥類的蛋。

AlphaFold此前兩代都是開源的,但出於商業的考慮,Jumper 團隊2024年5月發佈的 AlphaFold 3是不開源的。

AlphaFold 3是目前最強大的結構預測工具之一,它可以預測相互結合的蛋白質、DNA 和、RNA 以及其他小分子的結構。不過,因爲AlphaFold 3引入了“diffusion模型”,也就是那些文字生圖、文字生視頻的底層技術,所以也無可避免地會引入這個模型的“幻覺”問題。

至於AlphaFold 3,以及未來的第n代AlphaFold會不會胡說八道……就交給諾獎得主們去操心吧。

參考文獻

[1]https://www.163.com/sports/article/BHLG664200051CAQ.html

[2]https://achievement.org/achiever/demis-hassabis-ph-d/#interview

[3]https://achievement.org/achiever/demis-hassabis-ph-d/

[4]https://www.nural.cc/deepmind-ai-framework/

[5]https://deepmind.google/discover/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-by-40/

[6]https://www.businessinsider.com/the-incredible-life-of-deepmind-cofounder-demis-hassabis-2017-5

[7]Jumper, J. M. (2017). New Methods Using Rigorous Machine Learning for Coarse-Grained Protein Folding and Dynamics. Knowledge UChicago. Retrieved from [8]https://knowledge.uchicago.edu/record/229?v=pdf

[9]How AI Revolutionized Protein Science, but Didn’t End It | Quanta Magazine. (2024, June 28). Retrieved from [10]https://www.quantamagazine.org/how-ai-revolutionized-protein-science-but-didnt-end-it-20240626

[11]Booth, H. (2024). See Everyone on the 2024 TIME100 AI List. Time. Retrieved from https://time.com/7012710/john-jumper-2

[12]Nature’s 10. (2021, December 15). Retrieved from https://www.nature.com/immersive/d41586-021-03621-0/index.html#section-7cgEBpkV9L

[13]Sosnick, T. R. (2023). AlphaFold developers Demis Hassabis and John Jumper share the 2023 Albert Lasker Basic Medical Research Award. J. Clin. Invest., 133(19). doi: 10.1172/JCI174915

[14]Browne, G. (2021). DeepMind’s AI has finally shown how useful it can be. WIRED. Retrieved from https://www.wired.com/story/deepmind-protein-folding-database

[15]Heaven, W. D. (2021). DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology. MIT Technology Review. Retrieved from https://www.technologyreview.com/2020/11/30/1012712/deepmind-protein-folding-ai-solved-biology-science-drugs-disease

作者:麥麥,遊識猷,李小葵

編輯:窗敲雨

封面圖來源:Anjney Midha