☰

擊敗GPT-4的那羣人

機器之能報道

編輯：吳昕

GPT-4 結束了“獨孤求敗”的日子。

前幾天，OpenAI 最大的競爭對手 Anthropic 發佈了新一代 AI 大模型系列 —— Claude 3。該系列包含三個“杯型”，按能力由弱到強（價格由低到高）排列分別是 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。

其中，能力最強的 Opus 在多項基準測試中得分都超過了 GPT-4 和 Gemini 1.0 Ultra，在數學、編程、多語言理解、視覺等多個維度樹立了新的行業基準。

Anthropic 表示，Claude 3 Opus 擁有人類本科生水平的知識。

這兩天各種體驗案例洶涌而至，讚歎聲絡繹不絕。除了聰明，很少有人提及與其他競爭對手相比，Claude 的另一個重要優勢——它不太可能說出有害的話，部分原因是它有一種名爲“憲法 AI ”的訓練技術：

先給模型頒佈一份“憲法”，然後告訴它儘可能遵循這些原則。“憲法”條款來源比較多元——從聯合國人權宣言到社交媒體社區規則，還包括 Anthropic 自己定的規則。然後使用第二個 AI 模型來評估第一個模型的“合憲程度”，在必要時對其進行糾正。

儘管如此，他們仍然會在發佈前夜感到緊張和高壓。去年夏天， Claude 2 發佈前夜，一羣表情焦躁的工程師不斷討論發佈當天可能出現的各種問題。如果新用戶的激增壓倒了公司的服務器怎麼辦？如果模型不小心威脅或騷擾別人，造成（微軟必應式）的公關難題怎麼辦？

在一間會議室裡，Anthropic CEO Dario Amodei 也在仔細研究自己心中的潛在災難清單，他總是會擔心這個模型會不會做一些大家沒有注意到的可怕事情？

當時，他們花了幾個月纔將 Claude 2 推出去，部分原因是公司的紅隊成員不斷想出新的方法，讓它可能變得危險。

某種意義上，這種對 AI 的擔憂正是 Anthropic 存在的原因。這是由一羣前 OpenAI 員工於 2021 年創立的公司，由於越來越擔心 OpenAI 變得過於商業化，他們宣佈分拆出去、組建自己的 AI 企業，稱爲“ AI 安全實驗室”。

CEO Dario Amodei 今年 41 歲，是普林斯頓大學畢業的物理學家，曾領導開發 GPT-2 和 GPT-3 的 OpenAI 團隊。他的妹妹 Daniela Amodei 今年 36 歲，曾負責監督 OpenAI 的政策和安全團隊，也是公司總裁。

幾位聯合創始人研究了所謂的“神經網絡縮放定律”—— 依據其揭示的數學相關性，AI 研究人員可以根據其訓練的數據量和算力來預測 AI 模型能力。他們在 OpenAI 就發現，只需爲模型提供更多數據並添加更多算力，就能讓模型更智能，而無需對底層架構進行重大更改。他們也擔心，如果這些機構繼續製造越來越大的模型，很快會達到一個危險的臨界點。

起初，他們考慮使用其他公司的 AI 模型進行安全研究。但很快發現此路不通，搞尖端的安全研究得有自己的基礎模型（費曼學習法？），這又帶來一個更爲現實的難題——怎麼籌錢購買貴得要死的 GPU？

權衡下來，他們決定將 Anthropic 變成一家公益企業（ a public benefit corporation ）。根據當地法律，這種新企業形態將使他們能夠兼顧利潤和社會責任（所謂的初心）。他們把自家 LLM 命名爲 Claude ，被賦予樂於助人、無害和誠實的使命。

“沒有一個主流 AI 實驗會像 Anthropic 那樣完整體現出有效利他主義。”《紐約時報》在去年的一篇報道中評價說。

對於有效利他主義者而言，一個很重要的目標就是改善這個世界，而且做到越有效率越好。這意味着他們會透過理性分析、衡量狀況，確保手中資源能夠發揮最大效益，以實現目標。

《紐約時報》記者發現，公司的許多早期員工都是有效利他主義者，大部分啓動資金也來自有效利他主義陣營裡一羣富有的科技高管，其中包括 Facebook 聯合創始人 Dustin Moskovitz、 Skype 聯合創始人 Jaan Tallinn。2022 年，Anthropic 收到了 Sam Bankman-Fried 的支票——失敗的加密貨幣交易所 FTX 創始人，在他的帝國崩潰之前，他向 Anthropic 投資了 5 億多美元。

Anthropic 對安全的癡迷對公司的形象有好處（特別是對立法者和監管者而言），但也被質疑放慢了模型進化速度，影響模型表現。

最早的 Claude 就比較沉悶和愛說教，在一些衆籌的人類評估榜單上，Claude 2 還沒 Claude 評級高，雖然 Claude 2 更安全。不過，Claude 3 在兼顧安全護欄和用戶體驗上要比前輩做得更好。Anthropic表示，靠近安全護欄但實際無害卻被 Claude 3 拒絕的 Prompts 大概有 10%，而 Claude 2.1 有 25%。

由此，同樣注重安全的企業用戶也順理成章地成爲他們的主要客戶——出售給大公司，或將大模型變成利潤豐厚的訂閱產品，這與專注消費者市場 Infection AI、Character AI 甚至 Open AI 等對手有所不同。兩位瞭解其財務狀況的人士告訴《紐約時報》，該公司去年月收入約爲 800 萬美元，預計今年將增長約 8 倍。

Claude 的客戶包括科技公司Gitlab、Notion、Quora 和Saleforce（也是Anthropic 的投資人）；金融巨頭橋水基金、SAP 以及商業研究門戶網絡 LexisNexis、SK 電信和全美最佳癌症醫院之一丹娜-法伯癌症中心。

Claude 3 也更多考慮了企業用戶。比如，Claude 3 Opus 主要瞄準那些需要從事非常前沿的複雜數據分析、生物醫學研究的企業。Sonnet 便宜了很多，用於更爲常見的應用，比如大型數據的存儲與搜索、銷售預測和代碼生成。Haiku 最便宜，主要用與客戶實時交流，比如物流查庫存、內容審覈。

最近，Anthropic 又以 184 億美元的估值籌集了 7.5 億美元（至此，他們在一年內獲得了 73 億美元的融資），計劃在未來幾個月增加代碼解釋、搜索和資源引用等功能。

斯坦福大學計算機科學教授 Percy Liang 曾表示“讚賞 Anthropic 對 AI 安全的承諾”，但也擔心該公司會陷入商業壓力，要求發佈更大、更危險的模型。Dario Amodei 對於這些擔憂的迴應是，想要與 OpenAI 和其他頂級實驗室競爭的主要原因不是爲了賺錢，而是爲了更好地進行安全研究。

他們相信他們正在採取正確的預防措施，最終，他們希望他們對安全的癡迷能在硅谷更廣泛地流行起來。“我們希望會有一場安全競賽，”Anthropic 聯合創始人之一 Ben Mann 去年在接受《紐約時報》採訪時曾說。“我希望不同的公司會說，'我們的模型是最安全的。然後另一家公司會說，'不，我們的模型是最安全的。”

https://www.forbes.com/sites/alexkonrad/2024/03/04/anthropic-releases-claude-3-claims-beat-openai/?sh=7516bea957bc&utm_campaign=socialflowForbesMainTwitter&utm_source=ForbesMainTwitter&utm_medium=social

https://www.nytimes.com/2023/07/11/technology/anthropic-ai-claude-chatbot.html

https://www.nytimes.com/2024/02/20/technology/anthropic-funding-ai.html?utm_source=pocket_saves

轉載請聯繫本公衆號獲得授權

投稿或尋求報道：content@jiqizhixin.com

擊敗GPT-4的那羣人

相關資訊