鯨世界|李飛飛與她創造的新獨角獸
圖片來源:李飛飛社交媒體
藍鯨新聞10月14日訊(記者 朱儁熹)當瑞典皇家科學院宣佈將2024年諾貝爾物理學獎授予兩位AI先驅後,不僅公衆大爲震驚,連獲獎的"AI教父"Geoffrey Hinton本人在接到獲獎通知時也不敢相信,直言"我怎麼確定這不是一個詐騙電話"。
並非所有人都認可這一授獎,有計算機科學專家表示,"諾貝爾獎委員會不想錯過這波人工智能的熱潮,所以巧妙地通過物理學的渠道把Geoffrey Hinton推了上去。"諾獎委員會還在社交媒體上發起投票:你知道機器學習模型是基於物理學方程嗎?結果過半的人選擇了"不知道"。
在短暫的驚訝後,AI行業內便開始了慶祝。Geoffrey Hinton的衆多學生、前同事、同行紛紛爲兩位獲獎者送上祝福。其中,同樣在人工智能領域立下開創性貢獻的"AI教母"李飛飛在社交平臺X上表示,"這真是令人無比興奮!AI的深遠影響纔剛剛開始。"
AI正逐漸成爲多學科交叉的領域。如果說Geoffrey Hinton是從心理學跨界進入AI,在研究神經網絡時還參考了一些物理學原理,那麼李飛飛的經歷與物理學的關聯則更爲明顯。無論是早年求學,還是如今下場創業,她的人生軌跡中時常出現AI與物理學的交匯,而她對AI發展的貢獻同樣偉大,還間接幫助了Geoffrey Hinton的項目。
如今,Geoffrey Hinton對AI的研究已經得到諾貝爾物理學獎的承認,那麼我們有理由期待,在未來幾年內,李飛飛也可能會與這個全球最重要的科學獎項發生更直接的聯繫。
圖片來源:李飛飛社交媒體
更像物理學家的"AI教母"
李飛飛身上跟着很多頭銜:斯坦福大學計算機科學系教授、斯坦福以人爲本人工智能研究院院長、美國國家工程院院士、前谷歌副總裁……但她曾在公開場合表示,比起工程師,她覺得自己更像一位物理學家。
16歲時,李飛飛跟着父母從中國移民到了美國。原本的高知家庭一下陷入經濟上的困頓,必須依靠繁重的體力勞動爲生,還未成年的李飛飛也得去餐廳刷盤子補貼家用。高中畢業後,普林斯頓大學向李飛飛發來了全額獎學金,她最終決定前往並主修物理學專業。
在本科期間,李飛飛着迷於閱讀物理學家的傳記。她發現,愛因斯坦、薛定諤、玻爾等偉大的人物到了職業生涯晚期時,都開始轉向探討人類的精神世界和生命奧秘。這讓原本堅定走物理學道路的李飛飛突然對自己的追求產生了懷疑,不自覺地追隨先驅的腳步開始思索生命的意義這類命題。
"對我來說,人類生命的基本問題就是智能。帶着這樣的探尋目光,我步入了神經科學的世界。在幾次神經科學領域的實習經歷中,更加確定了對智能的熱愛。於是,我從硬核的原子世界、物理世界,轉向了對智能的探索。"李飛飛後來在一檔播客節目中提到。
到了碩博階段,李飛飛決定轉到加州理工學院攻讀人工智能和計算神經科學。也是在那一時期,她選擇將計算機視覺作爲研究方向。現如今行業已經知道數據、算力、算法是AI的三大基礎,而計算機視覺相關的圖像數據正是最重要的數據分類之一,這一領域當時尚屬冷門,計算機能夠識別的物體種類極其有限。而業界大多觀點認爲算法纔是計算機視覺的核心,李飛飛卻意識到要想讓機器認知到更大的世界,或許還需要一個龐大的數據集。
計劃創建大規模圖像數據集的李飛飛很快遭到了同行勸阻、人手不足、缺乏經費等多重困難。她和團隊最終依靠亞馬遜衆包平臺,將海量的圖片標註工作分發給全世界近5萬名人員,纔將項目完成時間從19年大幅縮短到兩年半。2009年,日後影響整個AI行業發展的ImageNet數據集正式面世。初始版本共包含320萬張標記圖像,分爲超五千個類別,之後進一步擴展至1500萬張圖像。
但ImageNet數據集並沒有立刻獲得行業內的廣泛關注,李飛飛爲此還組織了大規模圖像識別挑戰賽,希望能提升ImageNet的名氣。而轉折點就發生在2012年舉辦的第三屆比賽上,也是在那時,李飛飛和Geoffrey Hinton的道路產生了交集。
那屆ImageNet比賽上,Geoffrey Hinton和他的兩位學生Alex Krizhevsky、Ilya Sutskever設計了一種新的神經網絡算法AlexNet,以高達85%的識別準確率奪得了當年ImageNet挑戰賽的冠軍,創下了計算機視覺領域的世界紀錄。AlexNet基於80年代就已提出的深度卷積神經網絡,但當時這套算法被業界視爲"老古董",直到經過ImageNet數據集訓練後才重獲關注。AI領域的深度學習革命也自此開啓。
擔心AI失控的AI先驅
時間來到2015年,Geoffrey Hinton的學生Ilya Sutskever與李飛飛的學生Andrej Karpathy出現在了同一個名單上:OpenAI的聯合創始人。
創立初期的OpenAI是一家非營利性組織,以構建安全且有益的通用人工智能爲使命。Ilya Sutskever擔任首席科學家一職,Andrej Karpathy則是研究科學家,兩人都推動了OpenAI在深度學習領域的發展。Ilya Sutskever更是領導了從GPT-1到GPT-4等多個大語言模型及ChatGPT項目的研發,爲OpenAI的崛起做出了巨大貢獻。
今年2月,Andrej Karpathy率先離職,轉爲創辦一家AI+教育公司。主導了去年OpenAI"宮鬥"的首席科學家Ilya Sutskever也於5月宣佈離職,啓動自己的創業項目。
造成Ilya Sutskever與OpenAI首席執行官Sam Altman之間矛盾爆發的關鍵在於,Sam Altman急於推動商業化,而Ilya Sutskever更擔心AI技術的安全與風險,於是在去年年底聯合董事會"罷免"了Sam Altman。但那場震驚全球AI業界的風波以Ilya Sutskever的妥協告終,Sam Altman很快便重返公司。自那之後,OpenAI頻繁出現高管人事動盪。截至目前,原來的11位創始團隊成員僅剩3位。
本月初,OpenAI完成了新一輪66億美元的融資,推高公司投後估值達1570億美元。作爲融資條件,OpenAI需要在兩年時間內轉型爲一家營利性企業,不再由非營利性董事會控制。這再度引發了對OpenAI是否會將商業追求凌駕於安全性之上的擔憂。
作爲Ilya Sutskever的老師,Geoffrey Hinton在發表諾貝爾獎獲獎感言時也力挺學生,稱"我特別爲我的一名學生解僱了Sam Altman而感到自豪"。這位AI泰斗還對人工智能可能造成的威脅發出警告,擔心比人類更智能的系統或將最終掌控一切。就在去年,時任谷歌副總裁的Geoffrey Hinton宣佈從谷歌離職,理由是想要不受約束地談論AI的風險,並表示對自己一生的工作感到後悔。
與Geoffrey Hinton相似,李飛飛也經常在各種活動中呼籲關注AI可能引起的社會災難風險。去年李飛飛出版自傳時,Geoffrey Hinton在推薦語中寫道,"她對自己幫助釋放的AI技術的巨大潛力和危險提供了緊急而清晰的描述。在這個關鍵時刻,我們迫切需要她來呼籲人們採取行動,共同承擔責任。"
2017至2018年期間,李飛飛曾擔任谷歌雲AI首席科學家。她稱這段經歷"刷新了自己的認知",讓她看到AI技術的社會意義。除了能夠推動社會的發展,AI也可能帶來侵犯隱私、虛假信息、取代人力等負面影響。因此從谷歌離開,重返斯坦福後,李飛飛推動創辦了斯坦福以人爲本人工智能研究院。這所機構希望能充當政界與科技界間的溝通橋樑,推動AI研究、教育、政策等方面的發展,以造福全人類。
但是,李飛飛和Geoffrey Hinton這兩位先驅在面對一項AI監管法案的態度上卻出現了分歧。作爲美國首批最重要、最嚴格的AI法規之一,加州SB 1047法案旨在對功能強大的前沿AI模型進行安全測試,將波及OpenAI等在加州部署業務的AI企業。
Geoffrey Hinton與衆多AI從業者對此聯名錶示支持,稱前沿AI公司合理防範大模型可能的危害是可行且適當的,SB 1047法案代表了向前邁出的重要一步。李飛飛則單獨撰文稱,她並不反對人工智能治理和立法,但AI政策必須促進開源開發,提出統一且合理的規則,建立消費者信心,而SB 1047未達到這些標準。
當地時間9月30日,加州州長Gavin Newsom正式否決了SB 1047法案,認爲該法案可能過於寬泛,會給AI公司帶來負擔。他還補充道,將會與包括李飛飛在內的多位專家合作,爲加州制定可行的AI模型防護措施。
瞄準三維物理世界的空間智能
今年5月,斯坦福官網上李飛飛的個人介紹頁面顯示,從2024年初到2025年底處於"部分休假"狀態。在職業社交平臺領英上,她的最新履歷也變爲"新手",從1月起開始全職做一些"新事物"。
不久後,李飛飛的新事業就得到了解密:一家專注於空間智能的AI初創公司。李飛飛是其聯合創始人兼首席執行官。團隊規模並不算大,公司現有24人,包括李飛飛在斯坦福的學生和多位華人科學家。
儘管尚未發佈任何產品或技術的突破,李飛飛這家名爲World Labs的初創企業卻在短短几個月內迅速成爲新的獨角獸。World Labs官網顯示,公司已籌集到超過2.3億美元的資金。領投方爲硅谷知名風投機構Andreessen Horowitz、NEA和AI風投基金Radical Ventures,其他投資者包括Adobe、AMD、英偉達等大公司,以及Geoffrey Hinton、Andrej Karpathy、谷歌首席科學家Jeff Dean等個人。
李飛飛曾多次解釋她所選擇的空間智能這一創業方向。在她的研究生涯中,視覺智能一直是其熱情所在。但現在她認爲,僅僅看見是不夠的,真正的看是爲了更好地行動和學習。而空間智能就是從二維進入到三維,在物理世界中進行感知、理解和交互。
在一場TED演講中,李飛飛展示了一張"貓伸出爪子要把裝有牛奶的杯子推下桌子"的圖片,來闡述空間智能的工作原理。她解釋稱,在看到圖片的一瞬間,人類大腦就會開始分析玻璃杯的形狀、在空間中的位置,以及與周圍物體的關係,併產生"想要行動的衝動"。這種衝動就是具有空間智能的生物的本能,能夠將感知和行動聯繫起來。
李飛飛團隊目前正在收集一個包含了行爲和動作的三維ImageNet數據集,用於訓練計算機和機器人如何在三維世界中行動。他們在機器人語言智能方面已取得一些成就,能夠根據口頭指令讓機械臂執行各種任務,例如打開抽屜、用麪包等材料製作三明治等。
如果以實現達到甚至超越人類智能的通用人工智能爲終極目標,現在的大多數AI還處於能夠與人類互動的初級階段,下一個門檻是如何讓AI具備高級推理能力。業界許多主流觀點認爲,可以通過構建更大、更復雜的模型來提升推理能力,就像OpenAI在9月發佈的o1推理大模型。
但李飛飛在最新的訪談中提到,如今的大語言模型和一些多模態模型在底層表示形式上仍然是一維的,與空間智能的方向完全不同。這只是生成式人工智能革命的第一章。在她看來,動物和人類等智能生物擁有在世界中互動、創造文明、甚至隨心所欲地完成各種任務的能力,將這些能力轉化爲原生的三維技術,纔是釋放潛在AI應用洪流的關鍵。
就像她在學生時代閱讀到的那些物理學巨匠,李飛飛的發言也常常蘊含一些哲學意味。"這也回到了我所追尋的北極星——爲什麼選擇空間智能,而不是平面像素智能?我認爲智能的進化路徑必然會轉向可操作性。"