「嗎嘍」在想啥?AI讀心術精準重建獼猴大腦圖像,網友:我們成三體人了
新智元報道
編輯:耳朵 Aeneas
【新智元導讀】荷蘭拉德佈德大學的研究團隊通過定位大腦注意力機制,在AI「讀心術」領域精確生成圖像,能夠依據大腦活動記錄極爲準確地重建獼猴所看到的內容。網友:這是人機融合的最終目標。
不知道大家上學的時候有沒有被老師拎着耳朵,痛心疾首地問:
講了八十遍還錯!我真想打開你們的腦子看看裡面到底在想什麼?!
我們無法敲開別人的大腦,很難知道知識到底有沒有鐫刻在大腦裡。要想做到這一點,好像只有神叨叨的讀心術能實現。
隨着AI技術的發展,不用開顱,不用植入設備,讀取頭腦裡的想法好像真的能實現。
連想法都能可視化,這莫非就是現實版「攝魂取念」?
「攝魂取念」洞察人腦
早在2022年,就有科學家研究過如何將人腦中的圖像可視化。
大阪大學前沿生物科學研究院的教授兩位科學家Yu Takagi和Shinji Nishimoto就發表了一篇論文,用擴散模型將大腦活動重現爲圖像。
論文地址:https://www.biorxiv.org/content/10.1101/2022.11.18.517004v2.full.pdf
兩位科學家招募了一羣志願者,讓他們每人看一萬張自然風景圖(不是一次性看完)。
看圖的時候,志願者躺在覈磁共振掃描儀裡,這個大腦攝像機會記錄下所有的大腦活動。
科學家得到腦內活動數據後,根據大腦不同的活躍部位,分爲兩部分,一部分是初級視覺皮層信號,另一部分是高級視覺皮層信號。
這些信號會化爲簡單線性模型裡的小點點,但想畫出能看懂的圖來,只靠它們是不行的。
科學家們會用到熱門的擴散模型Stable Diffusion。只要輸入一段文字,就能自動產生符合描述的圖畫。
結果發現,生成的圖像和志願者看到的實際圖像很接近,他們大腦裡產生的畫面差不多就是這樣子。
「在我們這項研究之前,還沒有哪個研究人員嘗試用擴散模型來重構視覺圖像。」Shinji Nishimoto頗爲激動地告訴媒體。
此項研究成果一出,那是不是意味着我們真的可以和自己的小狗小貓交流了?
或者說,這項技術可不可以用來取證呢?將嫌疑人的想法掃描成圖像,破案分分鐘。
「嗎嘍」在想什麼?
前陣子,嗎嘍表情包火了。
幾個小猴子頻頻能做出像人一樣的行爲作態,每一隻甚至還有名有姓。
坐在嬰兒車裡喝飲料,嗎嘍覺得飲料好不好喝?
小編晚上玩手機就這樣。那嗎嘍在看什麼好玩的東西呢?
嗎嘍看到人類的爆炸頭心裡在蛐蛐什麼呢?怎麼被嚇倒了?
荷蘭拉德佈德大學的研究團隊就在嘗試重現猴子腦中的圖像。
論文地址:https://www.biorxiv.org/content/10.1101/2024.06.04.596589v1
他們賦予人工智能系統專注於特定大腦區域的能力,能夠更好地從大腦記錄中重建猴子正在觀察的圖像。
現在,人工智能系統可以根據大腦活動的記錄,非常準確地重建一個人正在看什麼。
當人工智能進一步學會關注大腦的哪些部分時,這些重建圖像就會得到極大改善。
荷蘭拉德佈德大學的Umut Güçlü表示,「據我所知,這些是最接近、最準確的重構。」
Güçlü的團隊是全球使用人工智能系統,通過大腦記錄和掃描,來了解動物或人所看到的東西的團隊之一。
在之前的一項研究中,他的團隊使用功能性核磁共振成像(IMRI)掃描儀記錄了三個人在觀看一系列照片時的大腦活動。
在另一項研究中,研究小組利用植入電極陣列直接記錄了一隻獼猴在觀看人工智能生成的圖像時的大腦活動。
Güçlü的同事、拉德佈德大學的Thirza Dado說,這隻獼猴沒有被植入基因,因此我們無法重建它的感知,我們並沒有在猴子身上進行手術。
現在,研究小組利用改進後的人工智能系統重新分析了之前這些研究的數據,這個系統可以定位大腦中哪些部分最值得關注。
「基本上,人工智能在解讀大腦信號時,正在學習應該將注意力引向何處,」Güçlü說,「當然,這在某種程度上反映了大腦信號在環境中捕捉到了什麼。」
通過對大腦活動的直接記錄,一些重建的圖像現在非常接近猴看到的圖像,而這些圖像是由Style GAN-XL人工智能圖像生成的。
Thirza Dado說,與真實圖像相比,準確重建人工智能生成的圖像更容易,因爲人工智能在學習重建圖像的過程中,也會考慮到生成圖像的過程。
在使用注意力引導系統時,fMRI掃描結果也有明顯改善,但重建圖像的準確性稍有欠缺。
Dado說,這部分是因爲使用了真實照片,但從fMRI掃描中重建圖像也要難得多。「它是無創的,但噪音非常大」。
研究小組的最終目標是,通過刺激視覺系統中代表物體的高級部分,而不是簡單地呈現光的模式,創造出更好的大腦植入物來重現視覺所見。
例如,你可以直接刺激與「狗」這個概念相對應的部分,Güclǔ 說。「這樣,我們就能創造出更豐富的視覺體驗,更接近視力正常的人的視覺體驗。」
最近發表了大量利用AI再現動物所見的圖像,這種 「讀心術」的趨勢似乎正在擴大,圖像的質量也在提高。這是人工智能(即機器學習)應用越來越精確的必然結果。
網友:我們成三體人了?
對於這項技術將帶來什麼應用,網友們紛紛展開腦洞。
比如,顯然可以這種AI可以爲醫學做出貢獻,用在Neuralink的應用程序上,就可以更好地瞭解人腦。
如果心靈感應和腦機接口結合,我們如果想寫作是不是就不用動筆了?
當然,事情也可能會往可怕的方向發展:如果思想不再自由,而是能夠被獵人射殺,情況恐怕就不妙了。
看來咱們離思想透明的三體人,距離是越來越近了。
思維書寫技術起飛後,肯定是有利有弊。
但還是有部分人表示欣慰:使用腦電波的計算機控制成真,這將是人機融合的最終目標。
參考資料:
https://www.newscientist.com/article/2438107-mind-reading-ai-recreates-what-youre-looking-at-with-amazing-accuracy