☰

專注於推理的OpenAI“草莓”模型兩週內發佈？是人工智能下一重大突破

本文作者：杜玉

來源：硬AI

9月10日週二，據知名科技商業類媒體The Information援引多位測試過該模型的人士透露，站在時代風口浪尖的“AI寵兒”OpenAI計劃在未來兩週內發佈名爲“草莓”的最新人工智能產品，作爲ChatGPT所提供服務的一部分。這比兩週前傳聞的“秋季發佈”（9月至11月）要更早。

上述報道稱，專注於推理能力的人工智能“草莓”發佈前後還有一些亟待解決的問題，但看似“倉促上馬”似乎說明OpenAI感受到了大語言模型驅動產品領域的激烈競爭壓力，希望通過近幾個月被市場期待已久的草莓項目，來恢復ChatGPT首發以來兩年裡大部分時間的勢頭。

何爲“草莓”模型？專注於推理能力，是人工智能下一個重大突破

兩週前曾有消息稱，OpenAI加速推出“草莓”推理人工智能模型，以推動聊天機器人業務。四周前的消息稱，著名AI搜索公司perplexity CEO暗示已經提前用上了OpenAI的最新模型“草莓”。

華爾街見聞曾提到，早在5月時就有傳聞稱OpenAI正在神秘開發代號爲“草莓”的項目。兩個月前的7月13日，又有消息確認“草莓”是OpenAI正在開發新的人工智能模型，希望提供更高級推理能力以形成邁向通用人工智能（AGI）的重大突破。

具體來說，“草莓”模型憑藉增強的推理能力，能夠更好地處理令以往AI模型“撓頭”的複雜科學和數學問題，不僅能讓大語言模型（LLM）根據用戶的複雜查詢生成答案，甚至還能提前規劃，以便自主、可靠地瀏覽互聯網，進行OpenAI 定義的“深度研究”（deep research）。

評論普遍認爲，OpenAI的“草莓計劃”有望成爲人工智能下一個重大突破。更先進的推理能力意味着該技術可以“自主”執行更復雜任務，而不僅僅是依靠用戶的逐步提示行事。推理一直是AI在類人智能追求中最棘手的問題之一，而具有推理能力的人工智能模型不僅能改善數學和編程能力，還可以徹底改變科學研究，增強醫療保健和金融等複雜領域的決策力，並加速技術創新。

會顯著更貴嗎？“草莓”模型具體的提供形式和定價模式尚不確定

據悉，“草莓”發佈後雖然整體作爲ChatGPT的一部分，但也是一項獨立產品，可能會納入客戶選擇以支持ChatGPT運行的AI模型下拉菜單中，但具體的提供形式和定價模式都尚不確定。

與常規的對話式人工智能不同，“草莓”在迴應用戶的提示語之前會“思考”10到20秒，而不是立即給出答案。對於複雜或包含多個執行步驟要求的查詢語，“草莓”將比現有的GPT-4o版本更易於使用，不需要用戶明確告知ChatGPT“完成中間推理步驟以得出最終答案”等額外舉動。

有分析稱，這意味着“草莓”將成爲更加智能的助手，不僅在解決數學問題和編碼方面表現更佳，在更“主觀”的商業任務方面也更優秀，比如集思廣益制定產品營銷策略等。而且在這類偏創意的任務中，該模型將提供更針對用戶公司需求、更詳細的建議，比如生成每週執行計劃。

不過，假設發佈一切順利，在初始版本“草莓”只能接收和生成文本信息，而不能接收和生成圖像，這代表不像其他OpenAI模型那樣具備“多模態”功能，算是“缺點”之一。

同時，儘管“思考”階段有助於避免AI犯錯、且能預測如何全面回答用戶問題，但有測試過該模型的人士稱，一些簡單問題也會令草莓“思考”而無法迅速給出答案；答案質量僅略佳，不值得額外等待；而且有時無法在回答新問題之前記住並整合與用戶的先前聊天記錄。

在定價方面，上週曾有消息稱，ChatGPT Plus當前付費價格是每月20美元，但OpenAI考慮將“草莓”和被外界譽爲“ChatGPT 5”的“獵戶座”（Orion）等全新大模型擬定在月付2000美元，等於定價提升100倍。分析認爲，OpenAI能考慮如此高的價格跨度，主要是因爲缺錢、新產品足夠強以及手握數億用戶。

“草莓”模型爲何重要？或重新定義AI能力邊界，爲GPT 5提供高質量合成訓練數據

OpenAI首席執行官奧特曼（Sam Altman）曾在今年早些時候表示，人工智能領域“最重要的進步方向將是推理能力”。

而“草莓”項目被認爲就是去年披露出的OpenAI“Q*”計劃，該項目在公司內部已被視爲一項突破。觀看過演示的人稱能夠回答當前商用AI模型無法解決的棘手科學和數學問題。

奧特曼8月初發帖被外界認爲給“草莓”項目預熱

OpenAI曾在8月11日給出了未來AI發展的五個階段路線圖，第一階段便是現在具有對話語言的AI聊天機器人，第二階段是具有人類水平問題解決能力的“推理者”，第三階段是可以採取自主行動的“代理人”（AI agent），隨後是可協助發明的“創新者”和可完成組織工作的“組織者”。

而“草莓”極可能是幫助OpenAI實現第二級AI的關鍵，一旦成功將重新定義AI的能力邊界，自主執行復雜任務、獨立解決複雜問題並驗證輸出內容，代表人類離通用人工智能AGI又進一步。專注於推理的“草莓”可能也是爲下一代AI模型“獵戶座”或者說ChatGPT 5奠基的必經之路。

軟件開發機構Technology Rivers創始人兼CEO Ghazenfer Mansoor指出，藉助“草莓”項目，OpenAI對人類推理水平的追求不僅是技術奇蹟，更能突破界限、激發每個領域新的可能性。比如在商業領域，人工智能將能極大地改變供應鏈的管理方式，非常準確地預測市場趨勢，並在很大程度上使客戶體驗非常個性化。

而在普通用戶的層面，其使用體驗也會有所改進，例如具有推理能力的AI模型不僅能提供更優化的旅行計劃和健康建議，甚至可以分析用戶的消費習慣並創建完全定製化的預算方案，做更智能的助手。

總而言之，在理想化的情況下，“草莓”將能夠解決超出當前人工智能模型能力範圍的問題和任務，並進行“深入研究”，“比任何現有的聊天機器人都更勝一籌”。

還有分析指出，“草莓”計劃旨在籌集更多資金，OpenAI需要這筆錢來支持代號爲“獵戶座”的下一代前沿模型開發。而且，爲“獵戶座”模型生成高質量的合成訓練數據被認爲是“草莓”的關鍵應用之一，“這一點意義重大，因爲互聯網上的大部分訓練數據都已被使用殆盡”：

據知情人士透露，“草莓”項目包括一種專門的“後訓練”方法，即生成式AI模型已經過大量數據集上進行預訓練後，進一步調整模型以提高其在特定任務上的表現。這類似於斯坦福大學在2022年開發的“自學推理者”（Self-Taught Reasoner，簡稱STaR）方法。

STaR創造者之一、斯坦福大學教授Noah Goodman曾表示，STaR可以讓AI模型通過迭代創建自有訓練數據，“引導 ”自己進入更高的智能水平，理論上可用來讓語言模型實現超越人類的智能。但他也承認，“這既令人興奮又令人恐懼，人類（應就自身處境）需要認真思考一些問題了。”

專注於推理的OpenAI“草莓”模型兩週內發佈？是人工智能下一重大突破

相關資訊