專注於推理的OpenAI“草莓”模型兩週內發佈?是人工智能下一重大突破

本文作者:杜玉

來源:硬AI

9月10日週二,據知名科技商業類媒體The Information援引多位測試過該模型的人士透露,站在時代風口浪尖的“AI寵兒”OpenAI計劃在未來兩週內發佈名爲“草莓”的最新人工智能產品,作爲ChatGPT所提供服務的一部分。這比兩週前傳聞的“秋季發佈”(9月至11月)要更早。

上述報道稱,專注於推理能力的人工智能“草莓”發佈前後還有一些亟待解決的問題,但看似“倉促上馬”似乎說明OpenAI感受到了大語言模型驅動產品領域的激烈競爭壓力,希望通過近幾個月被市場期待已久的草莓項目,來恢復ChatGPT首發以來兩年裡大部分時間的勢頭。

何爲“草莓”模型?專注於推理能力,是人工智能下一個重大突破

兩週前曾有消息稱,OpenAI加速推出“草莓”推理人工智能模型,以推動聊天機器人業務。四周前的消息稱,著名AI搜索公司perplexity CEO暗示已經提前用上了OpenAI的最新模型“草莓”。

華爾街見聞曾提到,早在5月時就有傳聞稱OpenAI正在神秘開發代號爲“草莓”的項目。兩個月前的7月13日,又有消息確認“草莓”是OpenAI正在開發新的人工智能模型,希望提供更高級推理能力以形成邁向通用人工智能(AGI)的重大突破。

具體來說,“草莓”模型憑藉增強的推理能力,能夠更好地處理令以往AI模型“撓頭”的複雜科學和數學問題,不僅能讓大語言模型(LLM)根據用戶的複雜查詢生成答案,甚至還能提前規劃,以便自主、可靠地瀏覽互聯網,進行OpenAI 定義的“深度研究”(deep research)。

評論普遍認爲,OpenAI的“草莓計劃”有望成爲人工智能下一個重大突破。更先進的推理能力意味着該技術可以“自主”執行更復雜任務,而不僅僅是依靠用戶的逐步提示行事。推理一直是AI在類人智能追求中最棘手的問題之一,而具有推理能力的人工智能模型不僅能改善數學和編程能力,還可以徹底改變科學研究,增強醫療保健和金融等複雜領域的決策力,並加速技術創新。

會顯著更貴嗎?“草莓”模型具體的提供形式和定價模式尚不確定

據悉,“草莓”發佈後雖然整體作爲ChatGPT的一部分,但也是一項獨立產品,可能會納入客戶選擇以支持ChatGPT運行的AI模型下拉菜單中,但具體的提供形式和定價模式都尚不確定。

與常規的對話式人工智能不同,“草莓”在迴應用戶的提示語之前會“思考”10到20秒,而不是立即給出答案。對於複雜或包含多個執行步驟要求的查詢語,“草莓”將比現有的GPT-4o版本更易於使用,不需要用戶明確告知ChatGPT“完成中間推理步驟以得出最終答案”等額外舉動。

有分析稱,這意味着“草莓”將成爲更加智能的助手,不僅在解決數學問題和編碼方面表現更佳,在更“主觀”的商業任務方面也更優秀,比如集思廣益制定產品營銷策略等。而且在這類偏創意的任務中,該模型將提供更針對用戶公司需求、更詳細的建議,比如生成每週執行計劃。

不過,假設發佈一切順利,在初始版本“草莓”只能接收和生成文本信息,而不能接收和生成圖像,這代表不像其他OpenAI模型那樣具備“多模態”功能,算是“缺點”之一。

同時,儘管“思考”階段有助於避免AI犯錯、且能預測如何全面回答用戶問題,但有測試過該模型的人士稱,一些簡單問題也會令草莓“思考”而無法迅速給出答案;答案質量僅略佳,不值得額外等待;而且有時無法在回答新問題之前記住並整合與用戶的先前聊天記錄。

在定價方面,上週曾有消息稱,ChatGPT Plus當前付費價格是每月20美元,但OpenAI考慮將“草莓”和被外界譽爲“ChatGPT 5”的“獵戶座”(Orion)等全新大模型擬定在月付2000美元,等於定價提升100倍。分析認爲,OpenAI能考慮如此高的價格跨度,主要是因爲缺錢、新產品足夠強以及手握數億用戶。

“草莓”模型爲何重要?或重新定義AI能力邊界,爲GPT 5提供高質量合成訓練數據

OpenAI首席執行官奧特曼(Sam Altman)曾在今年早些時候表示,人工智能領域“最重要的進步方向將是推理能力”。

而“草莓”項目被認爲就是去年披露出的OpenAI“Q*”計劃,該項目在公司內部已被視爲一項突破。觀看過演示的人稱能夠回答當前商用AI模型無法解決的棘手科學和數學問題。

奧特曼8月初發帖被外界認爲給“草莓”項目預熱

OpenAI曾在8月11日給出了未來AI發展的五個階段路線圖,第一階段便是現在具有對話語言的AI聊天機器人,第二階段是具有人類水平問題解決能力的“推理者”,第三階段是可以採取自主行動的“代理人”(AI agent),隨後是可協助發明的“創新者”和可完成組織工作的“組織者”。

而“草莓”極可能是幫助OpenAI實現第二級AI的關鍵,一旦成功將重新定義AI的能力邊界,自主執行復雜任務、獨立解決複雜問題並驗證輸出內容,代表人類離通用人工智能AGI又進一步。專注於推理的“草莓”可能也是爲下一代AI模型“獵戶座”或者說ChatGPT 5奠基的必經之路。

軟件開發機構Technology Rivers創始人兼CEO Ghazenfer Mansoor指出,藉助“草莓”項目,OpenAI對人類推理水平的追求不僅是技術奇蹟,更能突破界限、激發每個領域新的可能性。比如在商業領域,人工智能將能極大地改變供應鏈的管理方式,非常準確地預測市場趨勢,並在很大程度上使客戶體驗非常個性化。

而在普通用戶的層面,其使用體驗也會有所改進,例如具有推理能力的AI模型不僅能提供更優化的旅行計劃和健康建議,甚至可以分析用戶的消費習慣並創建完全定製化的預算方案,做更智能的助手。

總而言之,在理想化的情況下,“草莓”將能夠解決超出當前人工智能模型能力範圍的問題和任務,並進行“深入研究”,“比任何現有的聊天機器人都更勝一籌”。

還有分析指出,“草莓”計劃旨在籌集更多資金,OpenAI需要這筆錢來支持代號爲“獵戶座”的下一代前沿模型開發。而且,爲“獵戶座”模型生成高質量的合成訓練數據被認爲是“草莓”的關鍵應用之一,“這一點意義重大,因爲互聯網上的大部分訓練數據都已被使用殆盡”:

據知情人士透露,“草莓”項目包括一種專門的“後訓練”方法,即生成式AI模型已經過大量數據集上進行預訓練後,進一步調整模型以提高其在特定任務上的表現。這類似於斯坦福大學在2022年開發的“自學推理者”(Self-Taught Reasoner,簡稱STaR)方法。

STaR創造者之一、斯坦福大學教授Noah Goodman曾表示,STaR可以讓AI模型通過迭代創建自有訓練數據,“引導 ”自己進入更高的智能水平,理論上可用來讓語言模型實現超越人類的智能。但他也承認,“這既令人興奮又令人恐懼,人類(應就自身處境)需要認真思考一些問題了。”