伯克利MemGPT團隊創業,要做開源的OpenAI,Jeff Dean也投了
機器之心報道
編輯:澤南
本週一,創業公司 Letta 面世的消息引發了人們的關注,它提供的技術可以幫助 AI 模型記住用戶和對話。
Letta 成立於加州大學伯克利分校(UC Berkeley)著名的實驗室創業工廠,並已宣佈獲得了由 Felicis 的 Astasia Myers 領投的 1000 萬美元種子資金,本輪估值爲 7000 萬美元。
Letta 還得到了人工智能領域一系列天使投資人的支持,其中包括谷歌的 Jeff Dean、Hugging Face 的 Clem Delangue、Runway 的 Cristóbal Valenzuela 和 Anyscale 的 Robert Nishihara 等。
這家由伯克利博士生 Sarah Wooders 和 Charles Packer 創立的 AI 初創公司備受期待,它是伯克利 Sky Computing Lab 的子公司,也是廣受歡迎的 MemGPT 開源項目的商業實體。
GitHub 鏈接:https://github.com/cpacker/MemGPT
伯克利的 Sky Computing Lab 由著名教授兼 Databricks 聯合創始人 Ion Stoica 領導,是 RISELab 和 AMPLab 的接班人,後兩個實驗室催生了 Anyscale、Databricks 和 SiFive 等公司。尤其是 Sky Lab,它催生了許多流行的開源大型語言模型(LLM)項目,例如 Gorilla LLM、vLLM 和 LLM 結構化語言 SGLang。
「在不到一年時間裡,實驗室很快就誕生了大量項目。他們就是坐在我旁邊的那些人,」Wooders 描述道。「那真是一段不可思議的時光。」
MemGPT 也是這樣一個項目,不過它的熱門程度很高,以至於還沒宣傳就火出圈了。
項目的創建者於 2023 年 10 月 12 日週四發佈了一份白皮書,並計劃在接下來的星期一將更深入的論文和代碼發佈到 GitHub 上。但有人偶然發現了這篇論文,並於週日將其發佈到 Hacker News 上。Packer 表示,它「在我們有機會正式發佈代碼、論文或發佈推文介紹之前就在 Hacker News 上火了,」他說。
項目主頁:https://memgpt.ai/
MemGPT 令人興奮的原因在於 —— 它的目標是解決大語言模型(LLM)的一個痛點:在其原生形式中,像 GPT-4 這樣的模型是無狀態的,這意味着它們不會將歷史數據存儲在長期記憶中。
這對於需要隨着時間推移逐漸瞭解和學習用戶的 AI 應用來說是個大問題 —— 從客戶支持機器人到醫療保健症狀跟蹤應用,很多潛在的 AI 應用需要我們讓大模型擁有「長期記憶」。而 MemGPT 管理數據和內存,以便大模型 Agent 和聊天機器人能夠記住以前的用戶和對話。
Packer 回憶說,MemGPT 論文的帖子在 Y Combinator 運營的網站 Hacker News 首頁上停留了 48 小時,他花了幾天時間在網站上回答問題,同時準備發佈代碼。MemGPT 項目在 GitHub 上發佈後,其鏈接再次在 Hacker News 上瘋傳。YouTube 上的採訪和教程、Medium 帖子、1.1 萬個星標和 1.2K 個 Fork 迅速涌現。
VC Felicis 的 Myers 也在閱讀有關 MemGPT 的文章時發現了 Wooders 和 Packer,並立即意識到該技術的商業潛力。
「我在論文發佈時就看到了它,」她表示,並立即聯繫了項目團隊。「我們的投資主題是圍繞人工智能智能體基礎設施,並且意識到其中一個非常重要的組成部分是數據和內存管理,以使這些對話聊天機器人和智能體有效。」
在找到最先看中他們的那家公司之前,MemGPT 團隊仍然在 Sand Hill Road 四處遊蕩,通過 Zoom 與風投公司進行通話。
與此同時,Stoica 還幫助公司結識了 Jeff Dean、Robert Nishihara 和其他知名的硅谷天使投資人。Packer 回憶說,天使投資的過程異常簡單:「伯克利的許多教授由於在本地工作,所以人脈很廣。他們都很關注這個實驗室即將商業化的項目。」
競爭和 OpenAI o1 的威脅
雖然 MemGPT 去年就已投入使用,但 Letta 的商業版本 Letta Cloud 尚未開放。截至週一,Letta 正在接受測試版用戶的請求。它將提供託管代理服務,允許開發人員在雲平臺上部署和運行有狀態智能體,可通過 REST API(一種可以維護狀態的編程接口)訪問。Letta Cloud 將存儲這樣做所需的長期數據。Letta 還將提供用於構建 AI 智能體的開發人員工具。
Wooders 看到了 MemGPT 的廣泛用途。「我們看到的頭號用例是高度個性化、非常吸引人的聊天機器人,」她說。但也有前沿用途,如「癌症患者的聊天機器人」,患者上傳他們的病史,然後分享持續的症狀,這樣 AI 就可以學習並隨着時間的推移提供指導。
值得注意的是,MemGPT 並不是唯一一家致力於此的公司。LangChain 可能是其最知名的競爭對手,它已經提供了商業選項。大模型的龍頭公司也在提供智能體工具,例如 OpenAI 的 Assistants API。
OpenAI 的 o1 新模型可能會讓用戶不再需要修復狀態。由於它是一個多步驟模型,因此它從根本上必須在一定程度上保持狀態,以便在回覆之前「思考」和核實事實。
但 Wooders、Packer 和 Myers 認爲 Letta 提供的產品與 OpenAI 存在一些關鍵差異。Letta 聲稱它可以與任何 AI 模型配合使用,並期待其用戶使用其中的許多模型:OpenAI、Anthropic、Mistral 以及他們自研的大模型。OpenAI 的技術目前僅適用於其自身。
更重要的是,Letta 正在使用開源 MemGPT 項目,並堅定地站在開源陣營一邊,並認爲開源是 AI 應用的更好選擇。
「我們將自身定位爲 OpenAI 的開放替代品,」Packer 說道。「構建最好的 AI 應用是非常困難的事,尤其是當你關心幻覺之類的問題時。」
參考內容:
https://techcrunch.com/2024/09/23/letta-one-of-uc-berkeleys-most-anticipated-ai-startups-has-just-come-out-of-stealth/