走出元宇宙陰影、擁抱開源AI模型,Meta實現“扎克伯格式復興”
來源:騰訊科技
2023年夏季,Meta創始人兼首席執行官馬克·扎克伯格(Mark Zuckerberg)面臨着一個關鍵抉擇:是否將生成式AI模型“Llama 2”開源,讓它與OpenAI的GPT-4一較高下。
在那幾個月前,初代Llama面世,它最初只是爲研究人員準備的,但在被泄露到網上後,立刻受到了開發者的歡迎,因其免費且開源,與OpenAI、谷歌等公司的收費模型不同。開源意味着,研究人員、開發者和其他用戶可以訪問底層代碼及其“權重”(決定模型如何處理信息),從而使用、微調或改進它。
Meta首席AI科學家楊立昆(Yann LeCun)和AI研究副總裁兼Meta FAIR團隊負責人喬勒·皮諾(Joelle Pineau)等高管,都希望Llama 2能更廣泛地開源。他們認爲,這將使Llama 2以更低的成本、更快的速度變得更強大,幫助Meta在AI競賽中追趕其他對手。在這場競賽中,Meta明顯落後,儘管它正試圖從元宇宙轉型的困境中恢復過來。
然而,開源也存在許多挑戰。一旦用戶習慣了免費產品,公司該如何實現盈利?此外,正如高管們在辯論中指出的,法律風險也不容忽視:如果有人惡意利用這個模型進行黑客攻擊,後果不堪設想。更令Meta擔憂的是,之前兩個開源AI產品都引發了廣泛批評,從科學家到參議員,無一不對Meta提出嚴厲指責。
此時,扎克伯格成爲了打破僵局的關鍵人物。他一直倡導開源技術(Facebook本身便是基於開源軟件構建的),但在做出決定前,他廣泛聽取了各方意見。Meta生成式AI主管艾哈邁德·達勒(Ahmad Al-Dahle)回憶道,扎克伯格與所有持支持、反對者以及持中立立場的人都進行了深入交流。最終,扎克伯格親自拍板,決定開源Llama 2,供研究和商業使用。
扎克伯格在個人Facebook頁面上發文,進一步闡釋了他的決定。他堅信開源能夠吸引更多開發者使用特定技術,從而推動創新。他寫道:“我相信,如果生態系統更加開放,將會帶來更多的進步。”
這一事件或許只是AI快速發展歷程中的一個小插曲,但對Meta和扎克伯格而言,Llama 2的發佈卻是一個至關重要的轉折點,它標誌着Meta將被重塑。到2024年4月Llama 3橫空出世,無論在速度還是準確性方面,已基本追上甚至超越了那些閉源的競爭對手。在幾個基準測試中,Llama 3模型甚至與OpenAI和Anthropic最好的模型相當,甚至表現得更好。Llama的一大優勢在於,Meta利用了數十億Facebook和Instagram用戶公開分享的數據來訓練其AI模型。
在開源AI模型(通常更透明、更靈活、更具成本效益,但可能更容易被濫用)與閉源模型(控制更嚴格,但缺乏透明度,開發成本更高)之間的哲學爭議中,Llama的故事或許將成爲關鍵篇章。更重要的是,Llama成爲了Meta全力投入生成式AI戰略的核心支點。
如今,扎克伯格在硅谷開發者眼中已成爲了“科技民主化”的捍衛者,而兩年前,他和Meta還因全力投入元宇宙而備受質疑和嘲笑,更因助長政治兩極分化、極端主義以及損害青少年心理健康而飽受詆譭。
早在Llama發佈之前,Meta首席AI科學家楊立昆就圍繞開源展開了研究
Llama模型崛起,
有望樹立新的行業標準
儘管ChatGPT在大衆心中仍是主流AI工具的代表,但實際上,Llama模型已悄然融入Meta的衆多產品中,每天服務着數十億消費者。從Facebook、Instagram、WhatsApp到Messenger的AI助手,再到用戶可自定義的AI聊天機器人,以及廣告客戶的文本生成工具,Llama變得無處不在。它甚至爲Meta與雷朋合作開發的智能眼鏡以及Quest頭顯中的智能助手提供技術支持,讓用戶能與周圍環境進行互動。傳聞中,Meta還在研發自己的AI搜索引擎。在開源AI社區Hugging Face等網站上,Llama模型的下載量已突破6億次大關。
Llama也是Meta聊天機器人Meta AI的“大腦”,該機器人可在Meta四大社交媒體上使用——Facebook、Instagram、WhatsApp和Messenger。Meta報告稱,在第三季度末,Meta AI已經擁有超過5億的月活躍用戶。扎克伯格預計,到今年年底,Meta AI將成爲使用最多的人工智能聊天機器人,超過OpenAI的ChatGPT、Alphabet的Gemini和其他競爭對手。Meta AI已經悄然確立了自己在生成式AI領域的領導地位。
然而,Meta的這一轉型卻讓不少觀察者感到費解。該公司不惜斥資數十億美元打造Llama,並預計2024年資本支出將高達400億美元,未來還可能繼續大幅增長。同時,Meta還將Llama免費提供給包括高盛、AT&T和埃森哲在內的數千家企業。這讓一些投資者不禁疑惑,Meta何時才能實現盈利,以證明這筆鉅額支出是值得的。
加州大學伯克利分校哈斯商學院的副教授阿布舍克·那格拉傑(Abhishek Nagaraj)也表示,從經濟角度來看,開源Llama對Meta的益處仍是個“大謎團”。
但不可否認的是,Llama的成功讓扎克伯格擺脫了外界對其超現實雄心的質疑,也幫助其公司度過了2022年底和2023年初的“效率年”困境。更重要的是,Llama的崛起爲扎克伯格提供了一個解決長期痛點的機會:即Meta的服務和產品常受蘋果和谷歌規則的限制,這兩個競爭對手的應用商店是Meta在移動設備時代的主要分發渠道。扎克伯格曾在博客文章中寫道:“我們必須確保自己始終能獲得最好的技術,並避免被競爭對手的封閉生態系統所束縛。”
如今藉助Llama,Meta和扎克伯格有機會樹立新的行業標準。他在財報電話會議上表示:“Llama 3.1將是行業的轉折點,開源AI將像Linux一樣成爲行業標準。”他提到了打破微軟Windows等專有操作系統主導地位的開源項目,暗示Llama有望引領這一變革。
或許正是這種潛在的可能性幫助扎克伯格重新恢復了信心。在他與人共同創立Facebook已逾20年後,40歲的他彷彿正經歷着一場所謂的“扎克復興”——個人形象與職業生涯均煥發出新的光彩。他已從往日的短髮轉變爲濃密的捲髮,單調的衛衣也被金鍊子和寬大的黑色T恤所取代,曾經棱角分明的面容如今常掛着輕鬆的微笑。甚至,在11月份,他還抽空與T-Pain合作翻拍了熱門歌曲《Get Low》,以此作爲送給妻子普莉希拉·陳Priscilla Chan)的週年紀念驚喜。
扎克伯格與好友T-Pain合作,爲紀念與妻子的“約會紀念日”表演《Get Low》
在AI領域深耕十年,
催生出類似互聯網的新行業
Meta在AI領域的探索可追溯到2013年,那時扎克伯格慧眼識珠,邀請了長期在紐約大學任教的AI專家楊立昆來掌舵Facebook新成立的FAIR實驗室。楊立昆回憶道,當他初談此職位時,首要關切的便是Facebook是否會將其研究成果開源。他向扎克伯格坦言:“好點子不應被壟斷,我們應儘可能廣泛地合作。”而扎克伯格給出的答覆令他倍感振奮:“哦,你大可放心。我們的平臺軟件及一切均已開源。”
然而,在生成式AI風起雲涌之前,Meta對AI的應用大多侷限於幕後,或是深耕於研究領域,或是作爲推薦算法和內容審覈的底層支撐。至於面向消費者的AI產品,如聊天機器人等,扎克伯格那時並無宏偉藍圖,尤其是當他的心思全然傾注於元宇宙之上時。
隨着OpenAI推出ChatGPT,生成式AI領域迎來了爆發式增長,而Meta的轉向在當時看來尤爲不明智。Meta的支出飆升,消費者卻反響平平,其股價更是一路跌至7年來的最低點,引發了諸如“扎克伯格是否陷入大麻煩”等種種質疑。在此背景下,Meta也不得不裁撤了數千名員工。
Meta首次嘗試推出的AI項目並未取得顯著進展。2022年11月,FAIR發佈了名爲Galactica的聊天機器人,它基於大語言模型構建,並接受了科學文本的訓練。與以往的FAIR模型一樣,Galactica也是以開源形式發佈的,旨在讓研究人員深入瞭解其運作機制。
然而,當時公衆尚未充分認識到大語言模型可能產生的幻覺現象,即它們有時會給出令人信服但錯誤的答案。Galactica的一些輸出內容令科學家震驚,因爲它提供了不科學的信息,如引用不存在的研究論文,討論如何在浴缸中製造“凝固汽油彈”、“吃碎玻璃有哪些好處”等不當言論。這些不當輸出引發了廣泛的批評,有人稱Galactica“不道德”,甚至是“Meta迄今爲止製造的最危險的東西”。
在遭受了多天的激烈批評後,Meta的研究人員決定關閉Galactica。而就在12天后,OpenAI發佈了ChatGPT,它迅速在全球範圍內走紅,儘管ChatGPT本身也存在幻覺問題。
在Galactica遭遇強烈反對後,FAIR的研究人員在整個冬季都在對新一代生成式AI模型進行微調,這款模型被命名爲LLaMA(Large Language Models Meta AI的縮寫)。在Galactica事件後,Meta變得非常謹慎,沒有將代碼和模型權重完全開放給所有人,而是要求研究人員申請訪問權限,並且不提供商業許可。當被問及原因時,楊立昆表示:“因爲上次我們向所有人提供大語言模型時,人們對我們嗤之以鼻,告訴我們這將破壞社會結構。”
儘管有這些限制措施,完整的LLaMA模型還是在幾周內被泄露到了網上,並在4chan和各種AI社區中傳播。Meta對在網上發佈該模型的網站提出了下架請求,試圖控制其傳播範圍。然而,一些批評人士警告Meta將面臨嚴重的後果,並嚴厲批評了它的做法:“準備好迎接大量垃圾郵件和網絡釣魚攻擊吧!”
恐慌情緒甚至蔓延至了國會山。2023年6月,兩名美國參議員致信扎克伯格,對Llama的發佈提出了批評,併發出警告,指出其可能被用於欺詐、傳播惡意軟件、騷擾以及侵犯隱私等不當行爲。信中稱,Meta傳播先進AI技術的方式“引發了嚴重的濫用問題”。
然而,與此同時,楊立昆卻表示,他和Meta的其他高層領導對於Llama模型的巨大需求感到驚訝。潛在用戶所期望的靈活性和控制權,將使得一個極爲強大的大語言模型得以開放訪問。
例如,律師事務所可以藉此訓練出專門用於法律領域的模型,並擁有相應的知識產權;醫療保健公司則能夠審計和管理模型背後的數據,確保符合各項規定;研究人員也可以對模型的內部工作原理進行試驗和檢查。楊立昆回憶道:“我們收到了許多請求,他們都表示,‘你們必須將這些資源開源。它極具價值,足以催生出一個全新的行業,就像一個新的互聯網一樣。’”
這些反饋直接引起了扎克伯格、首席技術官安德魯·博茲·博斯沃思(Andrew “Boz” Bosworth)以及楊立昆的重視,促使他們每週都要召開一次電話會議,共同探討應對策略。他們是否應該將下一個版本開源?開源的利是否大於弊?經過深思熟慮,扎克伯格最終下定決心,並獲得了多位高管的支持,於2023年7月正式公佈了開源模型。
皮諾(左)和達勒共同領導着Meta的生成式AI研發工作
不按套路出牌,
通過開源搶佔AI優勢賽道
值得注意的是,Llama 2並未實現完全開放。Meta並未透露用於訓練模型的數據集,其中包括Facebook和Instagram上的所有數據,這些數據被廣泛視爲Meta的關鍵競爭優勢。同時,Meta還限制月活躍用戶超過7億的公司使用其服務,主要是爲了防止大型科技競爭對手的介入。不過,源代碼和模型權重仍然可以下載,Meta也鼓勵用戶向協作社區貢獻改進意見、漏洞修復以及優化結果。
甚至在Llama 2發佈之前,扎克伯格就已經爲其爆火奠定了基礎,並將其視爲Meta的下一件大事。在首個Llama模型於2023年2月發佈後,扎克伯格迅速從整個公司抽調人員組建了專門的團隊,專注於加速生成式AI的研發進程,以便將其應用於Meta應用的各項功能和工具中。他選擇了前蘋果高管達勒來領導這個全新的團隊。達勒於2020年加入Meta,此前從事元宇宙產品的開發工作。
在2023年6月的一次內部全體會議上,扎克伯格分享了他對Meta AI未來的展望。他表示,Meta正在將生成式AI技術融入其所有產品中,並重申了該公司對AI研究採取“基於科學的開放方法”的承諾。達勒也表示:“我肩負着一項艱鉅的任務,那就是開發最先進的模型,並以創紀錄的速度將它們集成到產品中。”
簡而言之:Llama已成爲這場遊戲的主角。
對於一家年收入高達1350億美元的公司而言,Meta所採取的策略似乎並不符合常規邏輯。開源軟件通常被視爲一種技術推廣的手段,它更有利於那些與Meta這樣的行業巨頭競爭的小型初創公司或資源有限的團隊。
在2024年7月發佈的一篇題爲“開源是前進之路”的博客文章中,扎克伯格闡述了開放Llama的動機。他強調,這並不是一個無私的決定,而是出於戰略考慮。通過開源,Meta旨在在AI競賽中佔據有利地位,並最終將Llama打造成爲生成式AI領域的首選平臺。同時,他也指出:“公開發布Llama並不會像OpenAI或谷歌這樣的封閉服務提供商那樣,削弱我們的收入、可持續性或投資研發的能力。”
開源將打破AI壟斷,
暗含新的盈利機會
如今,Llama已經經過了一年多的實踐檢驗,扎克伯格的觀點在某些人看來頗具說服力。研究Meta的沃爾夫研究公司分析師什維塔·卡朱莉亞(Shweta Khajuria)認爲,將Llama作爲開源軟件發佈是Meta的“天才之作”。這一舉措不僅幫助Meta吸引了頂尖人才,還加速了其平臺的創新步伐,併爲其開闢了新的收入來源。她解釋說,開源的Llama使Meta能夠迅速趕上OpenAI、谷歌和Anthropic等競爭對手,部分原因在於成千上萬的開發者正在以驚人的速度對Llama進行構建和改進。她還指出:“如果Meta沒有選擇開源,那麼它可能需要更長的時間才能與其他前沿模型接軌。”
卡朱莉亞相信,Meta未來將擁有衆多新的盈利機會。例如,基於Llama的Meta AI功能可能會推出訂閱和廣告選項,以及AI驅動的應用內商業信息等。她說:“Meta擁有數十億用戶的龐大基礎,這是Perplexity、Claude和ChatGPT等競爭對手所無法比擬的。一旦這些AI服務在全球範圍內積累了足夠的用戶和使用量,它們就有可能實現盈利。”
扎克伯格還暗示,AI生成的內容本身將具有巨大的價值。在最近的財報電話會議上,他表示:“我認爲我們將迎來一個全新的內容類別,即AI生成或總結的內容,或者由AI以某種方式整合的現有內容。隨着時間的推移,這對於Facebook、Instagram、Threads或其他產品中的推薦體驗效果來說,將是非常令人振奮的。”
帕特里克·溫德爾(Patrick Wendell)是數據和AI公司Databricks的聯合創始人兼工程副總裁,該公司於7月在其平臺上部署了Meta的Llama 3.1模型。溫德爾認爲,Meta的這一舉措具有更爲深遠的影響。如果將互聯網視爲推動Facebook誕生的第一波科技浪潮,而移動時代則是由蘋果和谷歌主導的第二波科技浪潮,那麼“我認爲扎克伯格已經預見到第三波科技浪潮即將到來,他不希望看到只有一兩家公司完全控制所有AI的使用。避免這種情況的一個有效方法就是市場商品化,即免費提供核心知識產權,從而打破壟斷格局。”
而一些批評者堅決認爲Meta根本無權使用“開源”這一術語。他們指出,當前版本的Llama仍包含傳統開源軟件所不具備的限制,例如用戶無法訪問數據集。今年10月,開源術語的創造者——“開源促進會”對此提出了批評,指責Meta錯誤使用了這一術語,導致用戶陷入困惑,同時指出谷歌和微軟已經放棄使用該術語。
儘管術語的使用存在爭議,但Meta在關鍵領域取得了顯著成就。非營利組織艾倫AI研究所的研究科學家內森·蘭伯特(Nathan Lambert)表示,儘管開源的定義可能有分歧,但目前超過90%的開源AI模型都是基於Llama構建的。
在Meta內部,Llama與創收業務之間的聯繫日益緊密。今年1月,扎克伯格將AI研究團隊FAIR與在Meta應用程序中部署生成式AI產品的團隊整合到了同一個部門。楊立昆和皮諾現在直接向首席產品官克里斯·考克斯(Chris Cox)彙報工作,達勒也是如此。皮諾表示:“將FAIR與應用產品家族結合在一起是非常有意義的。”她指出,即使在重組之前,她的團隊所做的研究也往往能在幾個月後就應用到Meta的產品中。
扎克伯格還爲FAIR設定了一個更爲宏偉的目標:開發通用人工智能(AGI),即擁有類似人類智能的AI。雖然Meta更喜歡用AMI(高級機器智能)這一術語,但皮諾表示,無論名稱如何,Meta現在已經有了一個“真正的路線圖”來創造這種AI——而這個路線圖很可能就是依賴於不斷壯大的Llama。與此同時,該公司正在致力於開發Llama 4模型,目前該模型正在一個由超過10萬顆英偉達GPU組成的集羣上進行訓練。
小扎控制61%有表決權股份
不懼投資者質疑
然而,並非所有人都對Llama持樂觀態度。多年來,扎克伯格和他的公司一直在努力應對公衆對其在Facebook、Instagram和WhatsApp上使用其他類型AI進行個性化新聞推送、內容審覈和定向廣告的不信任。批評者指責其算法加劇了政治兩極分化、青少年心理健康危機以及錯誤信息的傳播。因此,Llama可能會面臨更加嚴格的審查。
一些批評人士還擔心,像Llama這樣的開源模型在惡意行爲者手中可能會變得非常危險,正是因爲其開放性過高。在當前緊張的地緣政治氛圍中,這些擔憂可能會進一步加劇。
即將上任的特朗普政府可能會爲Llama的開放之路增添更多變數。特朗普的經濟民族主義(Trump's economic nationalism)立場表明,他很可能不願意看到其他國家獲得美國製造的最先進AI模型。然而,Llama的未來走向可能取決於特朗普政府內部的不同聲音。副總統當選人萬斯(JD Vance)過去曾公開表達過對開源AI的支持,而像埃隆·馬斯克(Elon Musk)的xAI也已經將其聊天機器人Grok開源。
儘管如此,扎克伯格的一些老朋友對這種AI軍備競賽表示擔憂。Facebook的聯合創始人、現任Asana首席執行官達斯汀·莫斯科維茨(Dustin Moskovitz)就指出,雖然他不反對開源大語言模型,但他認爲不斷髮布更強大的模型可能並不合適。
然而,扎克伯格及其盟友堅信,開源模型的風險實際上比那些封閉的專有模式要小。他們主張,對開源AI進行過度的監管可能會扼殺創新。扎克伯格和Spotify聯合創始人丹尼爾·埃克(Daniel Ek)在今年8月共同撰寫的一篇文章中指出,開源開發是“利用AI推動進步、爲每個人創造經濟機會和確保安全的最佳途徑。”
無論Meta的開源行動最終結果如何,扎克伯格都被視爲這一變革的關鍵推動者。內部人士透露,他個人深度參與了推動Llama和開源的工作,這是Meta能夠如此迅速和專注發展的關鍵原因。克萊格表示,扎克伯格是少數幾個在創建大型科技公司後依然留任的領導者之一,他的直接參與使得決策過程更加高效。
爲了推動這一變革,扎克伯格一直在積極招募AI人才,並親自參與招募過程。據報道,他曾用個人電子郵件從谷歌DeepMind挖角研究人員,這些郵件中強調了AI對Meta的重要性。
埃裡克·梅傑(Erik Meijer)曾在Meta工作了8年,領導一個專注於機器學習的團隊。他認爲,只有像扎克伯格這樣的高管才能實現這種徹底的轉變。他比喻說,這就像一艘超級巨輪在轉向,需要強有力的領導人來引領整個公司向同一個方向前進。從某種意義上說,扎克伯格在公司內部就像是一個受人崇拜的英雄。
然而,隨着資本支出的飆升和Meta的轉型,投資者的耐心可能會受到考驗。沃爾夫分析師卡朱里亞表示,目前投資者對Meta的轉型持容忍態度,因爲Meta已經奠定了基礎並展示了未來的機會。但如果從2025年到2026年收入沒有開始加速增長,投資者可能會開始失去耐心。儘管如此,扎克伯格控制着Meta約61%擁有表決權的股份,因此他在一定程度上可以免受投資者不滿的影響。
楊立昆表示,Meta在GPU和生成式AI方面的鉅額投資需要一個願意冒險的領導者。幸運的是,Meta不僅有這樣的領導者,還有一個利潤豐厚的核心業務來爲這一願景提供資金。因此,Meta再次回到了科技和商業交匯處的對話中心,而這次討論的重點不再是虛擬化身等邊緣話題,而是關於AI的未來及其在商業中的應用。(騰訊科技特約編譯金鹿)
閱讀最新前沿科技研究報告,歡迎訪問歐米伽研究所的“未來知識庫”
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料範圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每週更新不少於100篇世界範圍最新研究資料。
截止到10月25日 ”未來知識庫”精選的100部前沿科技趨勢報告